Clear Sky Science · zh

虎甲草(Tigridiopalma magnifica)染色体级基因组组装

· 返回目录

一种稀有的林下美物及其隐藏的编码

Tigridiopalma magnifica是一种生长于中国南部少数阴凉山谷的引人注目的林下植物。其醒目的斑纹叶片和鲜艳的花朵使其成为自然界中的亮点,但野外种群濒危并受法律保护。本研究在整条染色体水平上揭示了该物种完整的遗传说明书,为理解其如何在特定生态位中生存以及人们如何更好地保护它奠定了基础。

Figure 1. 从脆弱的森林栖息地到完整的DNA图谱,展示解析珍稀植物如何为其保护提供依据。
Figure 1. 从脆弱的森林栖息地到完整的DNA图谱,展示解析珍稀植物如何为其保护提供依据。

为何该植物需要帮助

像许多地理分布狭窄的植物一样,Tigridiopalma magnifica面临栖息地丧失、污染、入侵物种、过度利用和气候变化等威胁。它依赖非常特定的条件,例如封闭树冠下的深度阴影、湿润的土壤和临近溪流。这些严格的生境需求与其有限的分布范围相结合,使其在中国被列为受威胁物种。迄今为止,该植物的保护工作主要依赖野外观察和简单记录,而缺乏详尽的遗传学信息。

将叶片和花朵变成数字DNA

研究人员从一株在植物园栽培且源自组织培养的单株中采集了叶片和花朵材料。从这些组织中提取了DNA和RNA,并进行了多种现代测序。长片段DNA采用Oxford Nanopore设备测序,而更短但高度准确的读取、三维DNA接触数据和RNA数据则来自另一种高通量平台。研究团队总共生成了数千亿碱基的序列,既捕获了原始的遗传密码,也提供了叶片和花朵中哪些基因活跃的线索。

Figure 2. 逐步将大量DNA读取组装为单株濒危林木植物的完整染色体。
Figure 2. 逐步将大量DNA读取组装为单株濒危林木植物的完整染色体。

从数百万片段组装完整染色体

原始测序数据以无数短片段的形式到达,必须像拼巨型拼图一样组装。团队首先对数据进行清理,然后使用专门的软件从嘈杂的长读取中拼接出长的DNA序列。额外工具用于移除反映植物两个亲本拷贝的重复片段,而非真正独立的基因组区段。随后利用Hi-C数据(显示基因组中哪些区域在细胞核内彼此接近)将这些长片段排序并定向,构建成22条类似染色体的结构,称为拟染色体。进一步的打磨步骤纠正错误并填补缺口,另有独立工具定位构成染色体末端的端粒和中央着丝粒区域的重复DNA。

最终基因组的样貌

最终基因组约包含2.17亿个DNA碱基,组织为22条拟染色体,染色体5号和15号内仅剩两个小缺口。每条拟染色体两端均可见端粒帽,并在每条染色体上识别出着丝粒,揭示了基因组的基本物理布局。质量检查表明95%的预期核心植物基因存在,准确性和连续性指标均很高。团队记录了约43,000个蛋白编码基因和近500个转运RNA基因。他们还描绘了占基因组三分之一以上的重复元件,并未发现该物种近期发生整基因组复制的明确迹象。

这对保护与未来研究的意义

这一染色体级基因组为科学家提供了一个详细的参考,用于研究Tigridiopalma magnifica如何适应其阴湿的森林栖息地以及其种群随时间的变化。有了这张图谱,未来研究可以追踪野生与栽培植物的遗传多样性,搜索与抗逆性或观赏性状相关的基因,并将该物种与其近缘物种进行比较。在实际应用上,新基因组是一个强有力的工具,可以指导更有依据的保护方案,帮助确保这种稀有的林下植物在自然和园艺环境中持续繁衍。

引用: Vu, D.Q., Xiao, TW., Wang, ZF. et al. A chromosome-scale genome assembly of Tigridiopalma magnifica. Sci Data 13, 781 (2026). https://doi.org/10.1038/s41597-026-07127-0

关键词: 植物基因组学, 濒危物种, 基因组组装, 保护遗传学, Tigridiopalma magnifica