Clear Sky Science · zh
基于稳健填补的古代低覆盖 DNA 眼睛、头发与皮肤颜色预测方法
从古代 DNA 看到面孔
当考古学家出土古代骨骼时,通常不知道这些人活着时的长相——他们的眼睛是什么颜色、皮肤多深,或头发是黑色、金色还是红色。本文提出了一种从极度损坏的 DNA 中读取这些可见特征的新方法,使科学家能够为遥远过去的个体勾勒出更具人性化的形象,并将相同思路应用于当代退化的法医样本。
为何古老 DNA 难以解读
长时间埋藏的遗骸中的 DNA 几乎成了生物学上的残骸。时间将其打碎成微小片段,并引入将一种碱基变为另一种的化学损伤。大多数古代基因组仅以“低覆盖度”测序,意味着许多位点仅被读取一次——或根本未被读取。现有的法医工具,如可从 41 个关键 DNA 标记预测眼、发、肤色的 HIrisPlex‑S,是为现代高质量 DNA 设计的,期望在每个标记的两个拷贝上都有可靠信息。对于古代材料,这些信息常常缺失或不确定,因此传统方法要么完全失效,要么给出非常不稳固的预测。

用智能推测填补空白
作者采用了一种称为基因型插补的策略,利用大型现代基因组参考面板中的模式来“填补”受损基因组的缺失片段。由于相邻遗传标记通常作为区块一起遗传,部分观测到的模式可以强烈指向最可能的缺失碱基。团队将这一思路封装为一个新的工作流程 aHISplex:从比对后的测序读段开始,运行最先进的插补软件,将结果转换为 HIrisPlex‑S 所需的精确格式,然后自动将预测概率转化为清晰的眼、发、肤色类别。
在现代与古代样本上检验准确性
为评估方法性能,研究者取了 93 个已知表型的现代基因组,并人工“下采样”以模拟非常低的覆盖度,低至整套测序的十分之一。他们随后对缺失标记进行插补,并将结果与真实数据比较。即便在仅有 0.5× 覆盖度时,41 个标记的总体错误率仍低于约 2%,而最严重的错误——将一个标记从一种纯合状态完全判错为相反纯合——极为罕见。大多数眼睛与头发颜色的预测与已知表型一致,皮肤颜色预测仅在相邻的色阶之间略有偏移。
来自罕见特征与古代多样性的挑战
并非所有特征都同样容易恢复。红发主要由 MC1R 基因中的罕见变异驱动,比较难以准确预测:该方法几乎不会无中生有地判断出红发,但有时会漏掉真正的红发个体,将其判为金色或深金色。团队还将工作流程应用于 31 名高质量基因组的真正古代个体,随后假装这些基因组是低覆盖并对其进行插补。再次显示总体准确率很高,在 0.5× 覆盖度下约有 95% 的关键标记被正确插补。然而,一小部分标记—样本组合,尤其是那些其遗传背景在现代参考面板中代表性较差的个体,表现出系统性更高的错误率。这种“参考偏差”可能会在部分运行中,例如将蓝眼基因型错误预测为棕眼。

使古代人物更清晰可见
尽管存在这些注意事项,该研究表明即使在 DNA 极其稀疏(仅 0.1–0.5× 覆盖度)时,也能实际预测许多古代个体的眼、发与皮肤颜色。新的 aHISplex 管道自动化了从原始测序文件到用户友好表型判定之间的复杂步骤,使其对考古遗传学实验室以及处理退化样本的法医团队更为可及。随着参考面板纳入更多多样化与古代基因组,以及科学家发现更多与表型相关的标记,这一方法应当变得更加精确——帮助我们从匿名的骨骼和 DNA 序列走向对古代生活者更生动且具伦理考量的肖像。
引用: Maróti, Z., Nyerki, E., Török, T. et al. Robust imputation-based method for eye, hair, and skin colour prediction from low-coverage ancient DNA. Sci Rep 16, 7371 (2026). https://doi.org/10.1038/s41598-026-38372-3
关键词: 古代 DNA, 法医表型推断, 眼睛 头发 皮肤 颜色, 基因型插补, 考古遗传学