Clear Sky Science · zh

基于计算的DNA条形码优于全基因组测序,用于从媒介监测样本中鉴定物种

· 返回目录

为什么微小昆虫很重要

每年因蚊子导致的死亡人数超过所有其他动物,主要通过疟疾、登革热和黄热等疾病造成。公共卫生团队试图追踪某一地区存在哪些蚊种以及它们是否携带寄生虫,但要快速且准确地完成这项工作并不容易,尤其是在撒哈拉以南非洲的许多地区。该研究探索了一种更快、更便宜的方法,利用袖珍型DNA测序仪读取蚊子及其携带病原体的遗传“条形码”,这种设备可以在靠近疫情发生地的区域实验室中运行。

Figure 1
Figure 1.

从野外陷阱到混合蚊样本

在实际监测中,陷阱常常捕获到混杂的多种蚊虫,而不是整齐的单只样本。为模拟这种情况,研究者在实验室里制作了五个“混合池”,由四种常见的携病蚊种组成:埃及伊蚊(Aedes aegypti)、两种传播疟疾的按蚊(Anopheles)以及库蚊(Culex quinquefasciatus)。在其中两个混合池中,他们还加入了三种寄生虫的DNA,包括疟原虫(Plasmodium falciparum)和两种导致丝虫病的蠕虫。因此每个混合池都类似于陷阱中混乱的真实情况:大量个体、若干物种以及有时存在的低丰度病原体。

以便携测序仪代替大型设备

研究团队测试了MinION——牛津纳米孔技术公司的一款手持设备,能够读取较长片段的DNA。与主要出现在富裕实验室的大型昂贵测序仪不同,MinION相对便宜、可通过笔记本电脑运行,并已被用于疫情调查。在本研究中,每个混合池的DNA在单独的MinION流动单元上进行测序。随后使用五种不同的软件方法分析得到的测序读取,以判断哪种方法能最好地反映样本中存在的物种和寄生虫及其比例。

全基因组与DNA条形码

一种策略是利用测序读取尝试覆盖蚊子和寄生虫的整个基因组。这种“全基因组”方法确实找到了每个混合池中的主要物种,但它经常错误估计这些物种的真实比例。密切相关的蚊种尤其难以区分,有些软件流程甚至将少量读取分配给实际上并不存在的物种。研究者随后尝试了一种更有针对性的策略:不是把读取映射到每个基因组的所有部分,而只映射到充当条形码的短而精心挑选的区域。这些区域(例如称为ITS2的一段核糖体DNA)在物种之间具有足够的差异以区分它们,但片段短且易于彻底测序。

Figure 2
Figure 2.

针对性条形码带来更清晰的结果

当团队将注意力集中在这些条形码区域时,物种丰度的估计与每个混合池的已知组成更为一致。ITS2区域和某些条形码片段组合与实际情况的匹配度最高,特别是在区分两种按蚊传播疟疾的媒介时。重要的是,这种聚焦方法也避免了“假阳性”:不会虚构并不存在的物种。尽管起始DNA质量仅为中等——类似于温暖潮湿的野外条件下可能获得的样本——MinION仍然产生了足够的条形码覆盖度,能够可靠地检测到蚊子以及低丰度的某些线虫寄生虫。

成本、简便性与现实应用

研究者比较了成本,发现使用MinION流动单元运行这些实验的大约费用是领先的Illumina测序平台的一半左右(未计大型设备的更高购置价和软件费用)。由于基于条形码的分析着眼于小片段DNA,它允许实验室使用简单的PCR反应来扩增这些区域,在实验室内为许多样本分配条形码后将它们合并,并在单次MinION运行中分析。数据处理需求也足够温和,经过培训的区域性非洲实验室人员就能处理,而无需依赖远端高性能计算中心。

对抗疾病的意义

简而言之,这项研究表明“智能采样”DNA——只读取关键的条形码片段而不是试图读取全部信息——可以更清晰且更便宜地呈现混合样本中存在哪些蚊种和寄生虫。这个基于计算的概念验证表明,未来的野外就绪试剂盒可能让本地团队快速扫描捕获的蚊群样本,判断是否存在危险物种或病原体,并在疫情扩大之前调整控制措施。通过将强大的遗传工具放入更小、更可负担的设备,这项工作指向了更为快速响应且基于本地信息的蚊媒疾病控制策略。

引用: Nascimento, C.L., Tonge, D.P. & Tripet, F. In silico DNA barcoding surpasses whole genome sequencing for species identification from vector surveillance pools. Sci Rep 16, 10231 (2026). https://doi.org/10.1038/s41598-026-39937-y

关键词: 蚊虫监测, DNA条形码, 纳米孔测序, 媒介传播疾病, 分子诊断