Clear Sky Science · zh

基于DNA的植物辨识与植物物种差异的基因组本质

· 返回目录

为什么微小的DNA差异对拯救植物很重要

植物支撑着我们的食物、氧气和生态系统,但即便是专家也常常难以区分近缘物种。这对追踪生物多样性丧失、执行贸易法规和恢复栖息地都很重要。本研究深入考察了植物DNA差异在基因组上的分布,并提出一个务实的问题:我们究竟需要多少以及哪种类型的DNA信息,才能可靠地将植物物种区分开?

从条形码到全基因组

科学家已经使用称为条形码的短DNA片段来鉴定许多动物和植物。在动物中,一个线粒体基因通常就能很好地工作。然而在植物中,来自质体DNA和核糖体区域的标准条形码经常模糊物种界限,尤其是在最近分化的群体中。这部分原因在于植物物种常发生杂交、质体DNA常常仅通过种子母系遗传,以及有时新物种在这些标准条形码区域变化不大而迅速形成。为突破这些限制,作者从基因组各处收集了大量核DNA数据,提供了更完整的视角来观察植物物种如何不同。

Figure 1. 利用分布于全基因组的植物DNA来可靠地区分许多外观相似的物种。
Figure 1. 利用分布于全基因组的植物DNA来可靠地区分许多外观相似的物种。

检验命名物种是否构成自然的遗传群体

研究团队汇总了来自151项研究的结果,涵盖134个植物属和1713个物种,每个物种都有多名个体和多段核DNA区域的取样。他们询问被归为同一物种的个体在基于核DNA构建的家系树上是否会聚成一组,这一模式称为单系群(monophyly)。大约70%的物种表现出这种模式,而约30%未能形成整齐的独立分支。这些不一致可能反映真实的生物学过程,如近期分化、持续的基因流动、杂交起源或多倍体,以及未解决或不一致的分类学问题。该发现证实,从核基因组角度看,许多但并非全部命名的植物物种对应清晰的遗传谱系。

每个物种有多少独特的DNA变异

接着,研究者更详细地检查了27个数据集,以统计物种特异的单核苷酸多态位点(SNP),即在一个物种中固定而在近缘物种中缺失的单个碱基变化。在462个物种中,89%至少有一个这样的独特SNP,典型密度约为每百万碱基约193个独特SNP,但范围很宽。一些属每百万碱基显示有数千个独特SNP,而最近分化的群体几乎没有。当物种标签被随机打乱时,独特SNP的明显信号大多消失,表明这些标记反映真实的生物学差异而非偶然。即便那些未形成清晰分支的物种,常常也携带一些独特SNP,提示即使在复杂群体中也存在有用的诊断性标记。

需要多少DNA才能区分物种

作者随后探讨平均需要多少个核SNP才能达到与完整数据集相同的物种区分度。通过在23个属中反复随机抽取SNP子集,他们发现物种分离度在大约100到500个SNP之间迅速提高,然后在约1500个SNP时趋于平缓,在该点大约可以恢复90%的可区分物种。约3000个SNP时,几乎所有属的表现都达到明显平台期。对于追踪整段基因而非零散SNP的研究,模式类似:通常100个或更少的基因就能达到与数百个基因接近的鉴别能力,在若干属中,一个特别有信息量的基因甚至能匹配全部数据的表现。在两个具有挑战性的群体中,仅使用7到9个最佳基因就达到了超过600或800个基因的区分效果。

Figure 2. 少数精心挑选的DNA区域可以像数百个基因组标记那样区分近缘植物物种。
Figure 2. 少数精心挑选的DNA区域可以像数百个基因组标记那样区分近缘植物物种。

这对未来植物DNA检测意味着什么

这些结果表明多数植物物种确实构成连贯的遗传群体,且通常在其核基因组中携带一些独特的DNA变异。它们还表明,高分辨率鉴定并不总是需要成千上万的基因:经过精心选择的从几个到数百个核区域,或几千个SNP,通常就足够了。这为开发更强大的基于核基因组的DNA检测方法打开了大门,这些方法能更好地区分近缘物种、改进环境监测并指出现行命名与遗传现实不符之处。开发这些工具需要协调努力和更多的基因组数据,但本研究为构建下一代植物DNA鉴定方法提供了量化的路线图。

引用: Huang, W., Li, DZ., Antonelli, A. et al. DNA-based identification of plants and the genomic nature of plant species differences. Commun Biol 9, 673 (2026). https://doi.org/10.1038/s42003-026-09858-7

关键词: 植物DNA条形码, 物种鉴定, 核基因组, 生物多样性监测, 遗传标记