Clear Sky Science · zh
用于全面解读嵌入核基因组的线粒体DNA的长读长人类泛基因组计划
藏在我们DNA中的信息
我们的每个细胞都携带两种遗传物质:一类位于细胞核内,另一类位于称为线粒体的小型能量工厂内。本研究提出了一个既关系健康又关乎祖源的令人意外的问题:当线粒体DNA片段移动到核基因组中时会发生什么?这些“偷渡”片段如何影响人类演化与疾病风险?

基因组中的隐秘乘客
线粒体DNA偶尔会脱离并插入到细胞核的染色体中。这些插入被称为核线粒体片段,长期以来被视为无害的化石。作者表明它们远比想象中更具动态性。借助新的长读长测序技术和代表来自世界各地数百人的“泛基因组”,他们构建了这些片段所在位置、流行程度及在人群和群体间差异的详细图谱。
短读序列错过的细节
旧的方法依赖短片段的DNA测序读段,常在基因组复杂区域失效。研究团队开发了一种基于图的分析方法,可同时叠加多个完整基因组,从而以更高精度追踪线粒体片段。这将灵敏度提高了约两倍半,尤其对长片段效果显著,并在人类中发现了超过一千个位点。他们区分了几乎所有人都带有的固定片段与在人群中可变的片段,甚至能够判定每个插入位于哪条染色体拷贝上。
这些片段落在哪里以及它们的功能
固定的片段倾向于位于基因之间的相对沉默区,即插入最不可能造成伤害的地方。可变片段分布更为分散,有时靠近或位于基因内部。研究发现,来自线粒体控制区某一特定末端的片段很少固定,并且在体外实验中可以微调邻近DNA的活性,这暗示基因组会筛除那些过度干扰调控的变体。作者还发现了若干与邻近基因开启方式或其剪接加工改变相关的插入,提示这些片段在性状和疾病风险上可能发挥微妙作用。

来自灵长类和重复DNA的线索
为将人类置于更广泛的背景中,研究者将这些插入与20种非人灵长类物种进行了比较。他们发现新的线粒体片段在数百万年间持续添加,但在灵长类不同分支中的速率各异,黑猩猩和倭黑猩猩尤为迅速。在人类和其他灵长类中,现有片段可随周围DNA一并被复制,形成簇状甚至串联重复。在某些情况下,这些重复位于或接近与表型(如着色)相关的基因,揭示出线粒体片段助力产生复杂变异的新途径。
细胞历史的活纪事
总体而言,这项工作将这些线粒体片段重新定位为活跃的参与者,而非死去的遗迹。它们记录了细胞隔室之间长期的DNA往来,显示基因组如何通过断裂与修复自我重组,并偶尔以微妙方式推动基因活性,使自然选择不得不应对。对非专业读者而言,结论是我们的染色体并非静态的蓝图,而是随着时间被线粒体DNA片段注释的活文档,继续影响生物学与演化。
引用: Fu, L., Chen, J., Lian, D. et al. A long-read human pangenome initiative for comprehensive interpretation of nuclear-embedded mitochondrial DNA. Nat Commun 17, 4371 (2026). https://doi.org/10.1038/s41467-026-71348-5
关键词: 线粒体DNA, 核基因组, 泛基因组, 人类演化, 基因调控