Clear Sky Science · zh

使用包含20个近完整日本单倍型的泛基因组图访问医学相关的复杂区域

· 返回目录

为什么这些隐藏的DNA很重要

我们的大部分DNA就像一座拥挤的重复街区,一直很难绘制清楚。然而,这些繁忙的区域对免疫功能、生育力和重大疾病有重要影响。本研究聚焦日本人群,展示了新一代测序工具如何最终详细描绘这些棘手区域,为医生和研究者提供更清晰的医学相关遗传变异图景。

为日本基因组构建更完整的地图

研究人员使用三种最前沿的技术对十名日本男性的基因组进行了测序,这些技术能读取长而准确的DNA片段并捕捉片段在三维中的排列。对每个人,他们重建了每条染色体的两条父母来源拷贝,得到20个近完整的“单倍型”。这些组装比以往大多数工作连续性更高,典型的DNA片段长度超过1亿碱基,每个人有几条染色体几乎从端到端无间隙。

与全球基因组参考的比较

在构建出日本单倍型后,团队将它们与两个现有参考基因组合并为一个称为泛基因组图的共享结构。不是单一“标准”基因组,这个图将许多个体序列及其差异编织在一起。比较显示,以前在1000基因组计划中观察到的大多数小变异被重现,许多较大的结构性改变也与其他东亚人群中发现的相符。与此同时,图中还揭示了一些重复的DNA片段和在日本样本中显得更常见甚至特异的序列变化。

Figure 1. 从多样的日本基因组到一个共享的复杂疾病相关DNA区域地图。
Figure 1. 从多样的日本基因组到一个共享的复杂疾病相关DNA区域地图。

聚焦医学重要的热点区域

许多与免疫、脊髓性肌萎缩、皮肤疾病和男性生育力相关的基因位于长的重复区内,这些区域尤其难以组装。团队挑选了30个此类复杂区域,包括知名的簇如KIR、HLA、SMN和β防御素。在这些区域,新构建的日本组装在性能上大大优于国际泛基因组项目(如人类泛基因组参考联盟)和中国泛基因组项目。平均而言,这些区域中超过90%的日本单倍型是完整的,无缺口、无可疑的测序覆盖下降,并且几乎没有与原始数据的不匹配。

此前未见的基因格局

借助更高的分辨率,研究人员发现了在早期全球数据集中未观察到的基因排列。在帮助引导自然杀伤细胞的KIR区域,他们发现了若干不常见的“B型”单倍型的例子,以及一个引人注目的情况:一组三个KIR基因串联重复。在与脊髓性肌萎缩相关的SMN区域,有两个日本单倍型携带三个SMN基因簇的拷贝,其中包含1份SMN1和2份SMN2。此前的泛基因组图中缺少此类模式,可能并非这些变异确实稀有,而是早期组装在这些高度重复的片段中断裂导致未能捕获。

Figure 2. 放大一个纠结的基因簇,展示长片段测序如何理顺重复序列并揭示隐藏的变异。
Figure 2. 放大一个纠结的基因簇,展示长片段测序如何理顺重复序列并揭示隐藏的变异。

复杂DNA中非随机进化的线索

研究还寻找了“基因转换”的迹象,即一个重复拷贝覆盖另一个,从而微妙地重塑DNA格局。在SMN和β防御素基因周围的区域,他们检测到许多此类事件,并发现有相当一部分似乎存在方向性偏倚,表明这些区域并非完全随意进化。随着来自其他人群的更多高质量单倍型被加入,这些模式可能有助解释为何某些基因拷贝和排列会变得常见或持续罕见。

对未来医学的意义

通过创建迄今为止一些最完整的日本基因组序列,这项工作填补了那些对疾病风险和治疗反应至关重要但难以触及的基因图谱部分。它表明长读长测序和泛基因组图能够捕获旧方法漏掉的微妙但重要的基因格局。对普通读者而言,信息是:我们对DNA的理解正在从草图走向详尽的地图,这张地图更能反映群体特异性多样性,并能支持在日本及全球范围内更精确的遗传学研究。

引用: Suzuki, Y., Owa, C., Kobayashi, H. et al. Accessing medically relevant complex regions with a pangenome graph of 20 near-complete Japanese haplotypes. Nat Commun 17, 4555 (2026). https://doi.org/10.1038/s41467-026-73461-x

关键词: 泛基因组, 日本遗传学, 复杂基因组区域, 长读长测序, 医学基因组学