Clear Sky Science · zh

濒危植物云南克雷吉亚的染色体级参考基因组

· 返回目录

濒临边缘的树木及其 DNA 的重要性

在中国南部和越南北部的石灰岩山地上,生长着一种鲜为人知的树——云南克雷吉亚。曾经分布更广,如今仅存于零散的森林斑块中,被正式列为受威胁物种。本研究绘制了该树全基因组的首个精细“路网”,这一资源可帮助科学家理解它如何适应环境,并为更明智的保护举措提供指导,防止其消失。

Figure 1
Figure 1.

这种稀有树木今天的生存处境

云南克雷吉亚属于锦葵科落叶乔木,和可可、榴莲等植物有亲缘关系。它仅分布于东亚,如今主要在云南省及毗邻的越南北部的岩石石灰岩坡上苟延残喘。几十年的森林砍伐和栖息地破碎化缩小了它的自然分布,只留下小而孤立的树群。由于这些剩余种群高度零散,它们随时间丧失遗传多样性的风险很高,从而降低了应对疾病、害虫或气候变化的能力。

从森林到基因组蓝图

为了捕获该物种的基因蓝图,研究人员首先从云南的野生树木采集了根、茎、叶和幼根尖,并立即将这些组织冷冻以保存其中的 DNA 和 RNA。随后他们用多种现代测序技术对树的 DNA 进行了高分辨率测序。来自 PacBio HiFi 的长而高准确度的序列与较短的 Illumina 读段以及一种揭示染色体内 DNA 物理折叠与包装方式的“Hi-C”技术相结合。该组合不仅能读取遗传密码,还能将其组装成与细胞内真实染色体相对应的长连续片段。

构建染色体并识别基因

最终组装的基因组约含 16.2 亿个核苷酸字母,类似于许多其他树种。团队能够将 98% 的序列组织成 41 条独立的染色体,这与他们在细胞显微镜下观察到的 41 对染色体相对应。使用标准质量检测的检验表明该组装既非常完整又非常准确:几乎所有预期的核心植物基因均被发现并正确组装。研究人员随后结合多种证据——与研究完善的植物的比较、该树自身的 RNA 证据以及计算预测——识别出近 59,000 个蛋白质编码区,并为绝大多数区段找到了可能的功能注释。

隐匿的大多数:重复 DNA 与小 RNA

与许多植物基因组类似,该树的大部分 DNA 并不属于经典基因。大约 72% 的基因组由重复序列构成,主要由一种称为长末端重复逆转座子(LTR)的跳跃遗传元件主导。团队还登记了数千个小型非编码 RNA 基因,包括微小的调控分子(microRNA)、帮助构建蛋白质的转运 RNA(tRNA),以及参与 RNA 加工的细胞机器组件。尽管这些元素本身不编码蛋白质,但它们共同影响基因的开启与关闭以及树对胁迫的响应。

Figure 2
Figure 2.

比较近缘物种并确认结果

为了检验基因组的可靠性,科学家们将原始 DNA 读段重新比对到组装结果上,发现几乎所有读段都能很好地匹配,这表明组装具有很高的准确性。他们还将这一新的二倍体基因组(代表普通的两套染色体)与先前发表的、更复杂的来自四倍体植物的版本进行了比较。基因配对间的匹配模式和沉默性 DNA 变化率显示这两种组装高度一致,本质上描述的是同一物种。这一交叉检验进一步增强了基于该参考基因组开展保护遗传学研究的信心。

这一基因组如何帮助拯救物种

通过将一种濒危树木的 DNA 转化为细致的染色体级图谱,这项工作为保护提供了强有力的工具。科学家现在可以定位哪些种群携带值得保护的独特遗传变异,追踪过去气候变化如何塑造该物种,并识别参与胁迫耐受或局地适应的基因。反过来,保护规划者可以利用这些见解设计种子采集、育种项目和栖息地修复计划,以维持该树的进化潜力。简言之,这一基因组将云南克雷吉亚从一个了解甚少的森林遗存,转变为一个可以用精确遗传信息而非猜测来指导其未来的物种。

引用: Cheng, Z., Xing, Y., Pan, Y. et al. A chromosome-level reference genome of an endangered plant Craigia yunnanensis. Sci Data 13, 567 (2026). https://doi.org/10.1038/s41597-026-06746-x

关键词: 濒危植物, 参考基因组, 森林保护, 植物遗传学, 云南克雷吉亚