Clear Sky Science · zh
一种分相的、近端粒到端粒的摩洛哥阿尔甘树染色体尺度参考基因组
一棵具有全球意义的沙漠树
摩洛哥阿尔甘树以其种子压榨出的丰富油脂闻名,这种油现在出现在世界各地的厨房和化妆品中。然而,这种耐旱树木的价值远不止装瓶销售:它养活人类和家畜,减缓沙漠化,并支撑农村生计。尽管重要性显著,阿尔甘林仍在气候变化和过度利用的压力下缩减。本研究提供了保护和改良这一标志性物种的强有力新工具:迄今为止最完整的阿尔甘树基因蓝图。
为何绘制阿尔甘树的蓝图?
阿尔甘树仅在摩洛哥的部分地区自然生长,它们有助于固土并维持当地经济,因此其林地被列入联合国教科文组织生物圈保护区。政府项目现正旨在修复退化林地并扩展现代果园以提高油产量。为明智推进这些计划,研究人员需要知道哪些树对高温、干旱和病害更适应,哪些携带更高且更稳定油产的性状。详尽的参考基因组类似于一张主地图,使科学家能够识别有用变异、追踪各地域的遗传多样性,并设计更好的保护与育种策略。

构建近完整的基因组
研究团队选择了一棵代表性强的阿尔甘树,取自摩洛哥的苏斯谷。他们采集幼叶以提取非常长且高质量的DNA,随后使用一种能以高准确度读取长片段遗传序列的先进测序技术。为了了解这些序列在染色体上的排列,他们又结合了一种捕捉细胞核内远端DNA片段相对位置的方法。将这些方法结合并通过最先进的组装软件处理,使研究人员能够重建该树两套基因组——分别来源于双亲的两份拷贝。
两套完整的染色体
每棵阿尔甘树携带两份基因组版本,本研究将它们解开为两套分别但相互匹配的序列,称为单倍型(haplotype)。每套被组织为十一条长的DNA链,对应于该树的十一对染色体。组装出的序列具有高度连续性,大多数染色体几乎从一端延伸到另一端,仅遗留很小的间隙。几乎所有染色体末端都发现了特殊的重复序列,表明团队已到达天然末端。将组装结果与数千个已知植物基因进行比对的测试显示,几乎所有预期基因均存在,质量检测也表明最终序列中阅读错误极少。
基因与重复序列揭示的内容
在基本结构就位后,研究人员将原始序列转化为可读的遗传要素目录。他们鉴定出超过35,000个位点的基因和近40,000种不同的基因转录本,其中许多得到了来自阿尔甘根、叶和种子RNA的直接实测支持。约四分之三的基因可与已知功能关联,提供了诸如抗逆性与油脂生成等过程的线索。团队还绘制了填充阿尔甘基因组大部分的大片重复DNA序列图谱。该基因组超过60%的DNA由重复序列构成,主要是那些在进化过程中复制并在染色体间扩增的移动遗传元件。

为保护和改良阿尔甘奠定基础
所有原始数据、组装基因组和基因注释均已公开,以便其他研究人员、育种者和保护工作者在此基础上开展工作。拥有高质量、近端到端的遗传参考后,就能定位与抗旱、抗病或优良油脂性状相关的变异,并监测随着林地缩减或新果园种植,遗传多样性如何变化。在实践层面,该基因组为更有依据的修复项目和更明智的苗木选择打开了大门,帮助确保阿尔甘树——以及依赖它的社区和景观——能在变暖和变干的世界中持续繁荣。
引用: El Idrissi, H., Gkanogiannis, A., Iraqi, D. et al. A phased, near-telomere-to-telomere chromosome-scale reference genome of the Moroccan argan tree. Sci Data 13, 412 (2026). https://doi.org/10.1038/s41597-026-06615-7
关键词: 阿尔甘树, 基因组组装, 摩洛哥, 保护遗传学, 阿尔甘油