Clear Sky Science · zh

早期单子叶植物托菲尔迪亚·藏草的染色体级基因组装配

· 返回目录

这株山地植物为何重要

在中国西南高山上生长着一种不起眼的草本——托菲尔迪亚·藏草,长期在民间用于胃病、止痛和皮肤病等疗用。其朴素的外表下隐藏着重要的科研价值:该植物位于单子叶植物系统发育树的靠近根部,单子叶是一个包括禾本科、百合等许多作物与观赏植物在内的大类群。通过解读其完整的DNA序列,研究者建立了一个详尽的参考基因组,这有助于追溯这些植物的演化过程,并可为未来研究该物种及其近缘种中的有用化合物提供线索。

Figure 1. 从山地草本到基因组图谱:一株植物如何揭示单子叶植物演化的故事及其药用潜力。
Figure 1. 从山地草本到基因组图谱:一株植物如何揭示单子叶植物演化的故事及其药用潜力。

一株羞怯的植物在生命树中的特殊位置

托菲尔迪亚·藏草生长在700到2300米的灌丛坡地与岩缝间,常被更鲜艳的花卉所掩盖。然而植物学家现在认为它属于单子叶植物中较早分支之一,接近导致许多熟悉开花植物分化的分裂点。其特殊的果实与种子形态早已暗示了其在植物演化中的独特地位。但由于其所属的托菲尔迪亚科几乎缺乏DNA数据,科学家长期难以准确界定其与近缘类群的关系。本研究通过构建高质量的整基因组图谱,旨在改变这一状况。

采集与读取植物的遗传脚本

研究团队从云南省的一株野生植物采集了根、茎、叶和花序,并迅速冷冻这些组织以保存其DNA和RNA。随后他们使用能够读取超长DNA片段的先进测序仪器,并辅以记录染色体内DNA片段空间邻近关系的方法。这两种策略使研究者能够估算总基因组大小、确认该植物为二倍体,并将大部分DNA组装为15条长的类染色体片段。严格的质量检测显示最终组装既高度完整又准确,捕获了几乎所有预期的核心植物基因。

基因组内部的样貌

在建立主干DNA框架后,研究者梳理序列以识别重复片段、编码基因以及不同类型的非编码RNA。他们发现近四分之三到四分之五的基因组由重复元件构成,尤其是一类可以复制并插入自身的新位置的活动转座元件,这有助解释基因组体积较大的原因。在这片重复序列的背景下,研究人员预测了超过五万三千个蛋白质编码基因,并确认绝大多数基因在现有数据库中可对应已知功能。他们还编目了数百个参与RNA加工及其它功能的基因,描绘出这一鲜为人知植物内在运作的丰富图景。

Figure 2. 从植物细胞到DNA重复序列和染色体的分步视角,解释科学家如何组装该植物基因组。
Figure 2. 从植物细胞到DNA重复序列和染色体的分步视角,解释科学家如何组装该植物基因组。

为植物演化研究提供新的锚点

因为托菲尔迪亚·藏草在单子叶谱系中很早分化,其新装配的基因组成为比较该类群其他物种的关键锚点。科学家现在可以用它来精炼演化树,追踪花、种子及湿地生态适应等关键性状的起源,并寻找与该植物传统药用相关的基因。对序列与注释的严格验证并公开发布意味着全世界的研究者都能在此基础上开展工作,以托菲尔迪亚·藏草为参照点更好地理解单子叶植物的历史与多样性。

引用: Chen, H., Wang, XY., Wang, JL. et al. The chromosome-level genome assembly of the early monocot species Tofieldia thibetica. Sci Data 13, 728 (2026). https://doi.org/10.1038/s41597-026-07062-0

关键词: 植物基因组, 单子叶植物演化, 托菲尔迪亚·藏草, 染色体组装, 重复DNA