Clear Sky Science · zh

高山耐极限植物藏雪莲(Saussurea hypsipeta Diels)的染色体水平基因组组装

· 返回目录

为何一朵山花的DNA至关重要

在青藏高原那被强风侵蚀的高坡上,生长着藏雪莲——一种被传统医学珍视、以能在严寒和强烈阳光下存活著称的羊毛状高山花卉。直到现在,科学家还没有这株植物完整的遗传蓝图,这限制了对其如何在极端环境中生存的理解,也阻碍了在气候与人类压力增加时保护该物种的努力。本研究提供了藏雪莲的完整染色体水平基因组图谱,为了解高海拔生物学和其活性成分的遗传根源打开了一扇窗。

Figure 1
Figure 1.

世界屋脊上的坚韧植物

属藏雪莲的Saussurea hypsipeta生长在约海拔4,000至6,000米之间,那里的稀薄空气、低温和强紫外辐射构成持续威胁。植物厚重的毛状被有助于隔热并减少水分流失,从而保护其免受严酷环境伤害。它在脆弱的高山生态系统中扮演重要角色,并长期用于藏医,治疗关节痛和妇科疾病等病症。然而,尽管其生态和文化价值显著,之前仅有其小型的叶绿体和线粒体基因组被破译;控制大多数性状的更大的核基因组仍是一片黑盒。

解读一个巨大而复杂的基因组

为应对这一挑战,研究者们在祁连山脉的一处岩坡上采集了野生植株的新鲜叶片,并在实验室提取了高纯度的DNA和RNA。他们结合了多种前沿测序策略:短而高度准确的DNA片段测序;能跨越难组装区的长、高保真读段;以及Hi-C技术,用于捕捉细胞核内DNA片段的空间邻接关系。多种技术的融合不仅让他们读出碱基序列,还能将这些序列拼接成长的连续片段,并最终按染色体组织起来,类似于把页面和章节组装成完整的书。

从碎片构建染色体

研究发现藏雪莲具有非常大且异常可变的基因组。团队估计其基因组大小超过30亿个碱基,可与人类基因组相比或更大,并发现相邻个体在许多位点存在差异,这种特征称为高度杂合性。高度变异会使组装软件混淆,可能错误地合并同一区域的不同版本。为克服这一点,科学家使用了能将亲本两套基因组分开的专用程序,并以更干净、更高质量的版本作为参考。他们随后用统计工具检测并去除冗余或错误拼接的片段。最后,利用Hi-C数据将组装片段排序并定向,形成16对染色体,覆盖了超过92%的基因组且留有极少空隙,独立质量检测也证实错误罕见。

Figure 2
Figure 2.

基因组揭示了植物的哪些特性

在构建出基本框架后,团队对其关键特征进行了搜索。他们发现约87%的基因组由重复序列构成,尤其是一类称为长末端重复(LTR)的移动DNA元件,这类元件可以自我复制并常常驱动植物基因组扩张。在这片重复区域中,他们鉴定出超过70,000个基因,其中约41,600个编码蛋白质,近29,000个产生参与细胞调控的各种非编码RNA。超过94%的蛋白编码基因可在主要生物数据库中找到对应条目,其基因大小与结构与菊科相关物种相似,这增强了基因组图谱完整性和准确性的信心。

为医药和保护开辟新途径

通过提供藏雪莲的详细染色体水平基因组,本项工作为未来发现奠定了关键基础。研究者现在可以寻找帮助植物抵御寒冷、干旱和强烈阳光的基因网络,深化我们对生物如何适应高海拔环境的理解,并可能指导培育更耐逆的农作物。同时,这一基因组为定位产生其抗炎和抗氧化化合物的基因与代谢通路提供了路线图,或有助于新药开发并支持更可持续地利用这一珍贵的高山药用植物。

引用: Wang, M., Hu, G., Yangjin, L. et al. Chromosome-level genome assembly of the alpine extremophyte Tibetan snow lotus, Saussurea hypsipeta Diels. Sci Data 13, 508 (2026). https://doi.org/10.1038/s41597-026-06931-y

关键词: 藏雪莲, 高海拔适应, 植物基因组组装, 药用植物, 菊科遗传学