Clear Sky Science · zh

犬烟 (Nicotiana attenuata) 与厚叶烟 (Nicotiana obtusifolia) 的染色体级基因组组装

· 返回目录

为什么野生烟草的基因组很重要

作物的野生近缘种常常蕴藏着帮助其抵御高温、干旱、昆虫和病害的遗传秘密。本研究以前所未有的细节级别解析了两种此类植物——犬烟和沙漠烟草——的 DNA 指令书。通过构建近乎无缺口的染色体图谱,这项工作为生物学家提供了强大的参考,帮助理解这些植物如何合成像尼古丁这样的强效化学防御物质,以及它们如何适应恶劣环境。

从沙漠植物到数字蓝图

犬烟(Nicotiana attenuata)和沙漠烟草(Nicotiana obtusifolia)自然生长于美国西南部的沙漠和峡谷。多年来,它们作为研究植物与食草动物、微生物和传粉者相互作用的模式物种被广泛使用。早期对其基因组的测序仅得到了粗糙的草稿:DNA 被分割成数千个片段,存在许多缺口和不确定的拼接。这种质量级别虽然能回答部分问题,但不利于跨物种比较基因或准确追溯新防御化学物质的起源。

Figure 1
Figure 1.

使用新测序工具构建染色体

作者们采用了更先进的 DNA 技术重新研究这些野生烟草,专门用于拼接非常大且富含重复序列的基因组。对于犬烟,他们以先前的长读长组装为起点,叠加了“Hi-C”数据,Hi-C 捕获的是 DNA 在细胞核内的空间接触情况。这些物理接触像线索一样表明哪些片段属于同一条染色体以及它们的相对顺序。借助专用软件,他们将 DNA 片段聚类、排序并定向,最终构建出 12 条全长染色体,覆盖了该植物大约 22 亿碱基的几乎全部基因组。

沙漠烟草的从头图谱

对于沙漠烟草,团队几乎是从头开始构建基因组。他们在 PacBio 测序仪上生成了高精度的长读长,然后将这些读段组装成数百个长片段。随后,像处理犬烟那样,利用 Hi-C 接触模式将这些片段拼接成 12 条染色体,总计约 13 亿个 DNA 碱基。额外的检测确保移除了来自微生物或其他污染源的零散片段,留下了干净且紧凑的植物遗传物质表示。

在重复序列的海洋中寻找基因

两种基因组都以重复 DNA 为主,约占其长度的五分之四,这类序列历来难以组装。新的长读长加 Hi-C 策略很好地处理了这种复杂性,使研究者能够在犬烟中识别出超过 35,000 个蛋白编码基因,在沙漠烟草中识别出超过 27,000 个。他们结合不同组织中 RNA 分子的证据以及来自相关茄科物种的比较信息来精炼基因预测。独立质量测试显示,几乎所有预期的核心植物基因都已存在且完整,长的重复元件也被准确表示——这些都是参考级基因组的标志。

Figure 2
Figure 2.

研究植物防御的基础

为确认这些组装的可靠性,团队检验了多条证据:沿染色体对角线整齐排列的 Hi-C 接触图、碱基精确度的统计测度以及达到顶级植物基因组典型水平的标准化完整性评分。随着这些稳健的 DNA 蓝图现已在公共数据库中可用,研究人员可以更容易地追踪尼古丁和其他专化化学物质的演化,比较调控植物—昆虫交战的基因网络,并探究近缘物种为何对环境胁迫有不同的响应。简而言之,这项研究将两幅此前模糊的遗传图景变为清晰的整页图谱,为未来在植物生态学、进化学和作物改良方面的发现奠定了基础。

引用: Chakraborty, A., Xu, S. Chromosome-level genome assemblies of Nicotiana attenuata (coyote tobacco) and Nicotiana obtusifolia (desert tobacco). Sci Data 13, 441 (2026). https://doi.org/10.1038/s41597-026-07080-y

关键词: 野生烟草基因组, 植物化学防御, 染色体级组装, 茄科遗传学, Hi-C 测序