Clear Sky Science · zh

低需冷量桑树 Morus macroura 的高质量染色体级基因组组装

· 返回目录

为什么这种特殊的桑树很重要

想象一种成熟较早、口感甜美、营养丰富,并且在冬季温和的地区几乎可以全年种植的水果。这就是一种长果桑——Morus macroura 的潜力,它在中国和南亚的部分地区已因鲜食、加工和传统医药用途而受到重视。到目前为止,育种者和种植者在改良该作物时主要依赖试错法,因为其遗传蓝图尚不清楚。本研究通过提供该桑树的详细染色体级 DNA 地图改变了这一状况,为更聪明的育种以提高产量、风味和气候适应性打开了大门。

Figure 1
Figure 1.

从果园到 DNA 蓝图

研究人员聚焦于一种名为“Sijiguo 72C”的栽培品种,该品种以果实特别长且对冬季低温要求低而闻名。他们从海南一株健康的单株幼叶中提取了非常纯净且很长的 DNA 片段。研究团队还收集了叶、茎、花和果实的 RNA,以获取植物不同部位活跃基因的信息。借助最先进的测序设备,他们将桑树的 DNA 和 RNA 读成大量短片段,生成的数据足以覆盖整个基因组超过五十倍的深度。

拼接遗传拼图

将数十亿个 DNA 字母拼凑成可用的基因组,就像在没有封面图片的大型拼图上装配碎片。研究团队使用长且高准确度的 DNA 测序读取来构建大型连续序列(称为 contig),尽量减少缺口和错误。随后他们应用了一种称为 Hi-C 的方法,检测在细胞核内哪些 DNA 片段彼此接近。这些远程接触信息帮助他们将 contig 排列并定向组装为 14 条大型单元,对应于桑树的染色体。在最终产物中,超过 99% 的基因组被整齐地定位在这些染色体上,质量检查显示每百万个 DNA 碱基中错误少于一次。

桑树基因组包含了什么

有了物理图谱,科学家们开始识别基因组中的功能单元。他们发现略多于一半的 DNA 由重复元件组成,例如跳跃基因和其他影响基因组大小与结构的重复序列。在这片序列景观中,他们预测了 21,824 个编码蛋白的基因,并通过与大型公共数据库比对确认了超过 97% 基因的功能。他们还编目了近 3,000 个非编码 RNA——这些不翻译成蛋白但参与调控基因开关的小 RNA 片段。综合这些特征,为理解如果实大小、颜色、风味以及植物在低需冷条件下开花和结果的能力提供了基础。

Figure 2
Figure 2.

在生命树上定位桑树

为了了解该物种在更广泛桑树家族中的位置,研究团队将其基因与包括其他桑属物种和桃在内的八种相关植物的基因进行比较。他们将基因归为跨物种共享的基因家族,并追踪哪些基因家族在进化过程中扩增或收缩。结果表明,Morus macroura 大约在四百万年前与普通白桑 Morus alba 分化,并且与另一种栽培类型 Morus atropurpurea 特别接近。研究还揭示了在进化过程中发生重排的染色体区段,为不同桑树物种如何适应各自环境和用途提供了线索。

这对未来果实意味着什么

对享用一碗桑果的人而言,DNA 序列的细节或许显得遥远。但这个高质量基因组为育种者和科学家提供了一本强有力的参考手册。它将帮助他们揭示控制冬季休眠、开花时间以及温暖气候下持续结果的基因网络。从实际角度看,这可能加速新桑树品种的研发,使其在变暖的世界中实现可靠收成,为市场提供反季节水果,并保持桑果数世纪以来备受珍视的营养与药用特性。

引用: Wu, H., Wang, J., Geng, T. et al. A high-quality chromosome-level genome assembly of the low chilling requirement mulberry, Morus macroura. Sci Data 13, 458 (2026). https://doi.org/10.1038/s41597-026-07117-2

关键词: 桑树基因组, 果树育种, 气候适应, 染色体组装, 植物遗传学