Clear Sky Science · zh
自六倍体油茶树Camellia osmantha的单倍型解析染色体级基因组组装
为什么一种产食用油的树很重要
许多人把山茶花视为漂亮的庭院灌木,但它的一些近缘种却是厨房里的重要作物。山茶籽榨出的油在亚洲部分地区备受推崇,是富含健康脂肪和具有保护性植物化合物的心脏友好型食用油。一个正在崛起的亮点是Camellia osmantha,这种耐性强、单产高的树种每公顷产油量远高于传统品种。要充分发挥其潜力,科学家需要了解它的遗传蓝图。本研究正是提供了这一点:一幅详尽且高分辨率的基因组图谱,为提高产量、改善油质以及培育能在变暖环境中茁壮成长的树木打开了大门。

一种前景广阔的新型油用树
Camellia osmantha是近年来被确认的油用山茶新种。它结合了农户关心的多种性状:对高温、低温和干旱具有较强的耐受性,而且产油量异常高——在仅五年生时,其产油量约为常见商业山茶树的两倍。像许多为产量选育的作物一样,它具有特别复杂的基因组:每条染色体并非通常的两份拷贝,而是六份。这种“自六倍体”特性使其DNA规模庞大,约为人类基因组的五倍,并充斥着重复序列。早期技术难以构建出干净、准确的基因组图谱,正是因为这种复杂性。
破解一个非常庞大的遗传谜题
为应对这一挑战,研究者结合了多种前沿的DNA测序方法。来自PacBio HiFi平台的长且高准确性测序读段提供了数千个碱基长度的连续序列,而Hi‑C数据捕捉了DNA在细胞内的折叠和包装方式——这些线索有助于将片段拼接成整条染色体。他们还收集了来自叶片的RNA数据以识别哪些基因正在表达。利用为多倍体植物设计的新型组装算法,团队拼装出一个长度为143.8亿碱基对的基因组,并且关键在于将其分离成六套互相对应的“单倍型”,每套代表一整套染色体拷贝。
首次清晰看到的六套完整拷贝
最终组装将110.8亿碱基对定位到90条长的类染色体支架上,整齐地分为六个版本的15条染色体。其中一个版本,称为单倍型1,尤其完整且干净,仅存在少量缺口,并且基准检测显示其完整度超过95%。在整个基因组中,科研人员编目了大量的重复DNA,尤其是几乎占序列近一半的长末端重复元件。在这一结构图谱之上,他们鉴定出60,212个蛋白质编码基因,并确认几乎所有基因都携带可识别的功能域,这表明基因集合既广泛又可靠。
与油脂合成和开花相关的基因
有了基因组,团队针对人们关心的性状进行了基因搜索。他们发现了3,269个转录因子——这些是调控其他基因的关键“开关”——以及2,655个类似已知抗病基因的基因,可能有助于育种者选择能抵抗害虫和病原体的树木。从农业角度最令人振奋的是,他们定位到80个参与油脂合成的基因,包括启动脂肪合成的酶以及调节种子中脂肪酸类型的关键酶。他们还编目了497个与开花时间和花发育相关的基因,这是将树木适配不同气候和生长季节的重要杠杆。

为改良树种和提升油质奠定基础
通过解析每一套六份染色体拷贝并对数万个基因进行细致注释,这项工作将一团庞大且纠结的DNA变成了可用的Camellia osmantha参考手册。植物育种者和分子生物学家现在可以追踪哪些基因版本与更高的产油量、更好的油质、更强的抗病性或对高温干旱的耐受性相关。从实际角度看,该研究为开发产量更高、更健壮并更适应气候变化需求的山茶油新品种提供了路线图——所有这些都始于对这种非凡树木细胞内部构成的更清晰认识。
引用: Zhang, Z., Hao, B., Li, M. et al. Haplotype-resolved chromosome-level genome assembly of an autohexaploid oil camellia tree Camellia osmantha. Sci Data 13, 395 (2026). https://doi.org/10.1038/s41597-026-06786-3
关键词: Camellia osmantha, 植物基因组, 多倍体作物, 食用油, 作物育种