Clear Sky Science · zh

多基因评分可迁移性的三大未解之问

· 返回目录

为什么从 DNA 预测健康比看起来更难

医生和研究人员越来越希望使用基于 DNA 的“多基因评分”来预测一个人患常见疾病(如糖尿病、心脏病或哮喘)的风险。但这些评分往往只在与最初研究志愿者相似的人群中效果良好,而这些志愿者通常具有欧洲祖源。本文探讨为何这些预测难以可靠“迁移”到具有不同遗传背景或生活环境的人群,以及这对在医学中公平使用遗传风险评分意味着什么。

多基因评分的承诺——以及它们的不足

多基因评分将遍布基因组的许多微小遗传变异的效应汇总为一个用于预测性状(如身高或血压)的数值。它们基于大规模的全基因组关联研究(GWAS),这些研究将 DNA 标记与数十万名志愿者的性状联系起来。然而,当这些评分应用于新的群体时,其准确性会有巨大差异。通常,预测效果随着新群体在遗传或社会层面上与原始 GWAS 参与者差异增大而下降。这被称为可迁移性问题:在一种情境下有效的评分在另一种情境下可能误导,从而在未经审慎使用时有可能加深健康不平等。

Figure 1
Figure 1.

超越祖源:基因图谱上的距离

为探究这一问题,作者使用了英国生物样本库(UK Biobank)的数据,该库包含超过 40 万人的基因和健康信息。他们基于一大群主要为英裔白人的参与者为 15 项高度遗传性的性状(如身高、体重、血细胞计数和胆固醇水平)构建了多基因评分。随后,他们测试了这些评分在 69,500 名其他参与者中的预测能力,这些人涵盖了广泛的遗传背景。研究团队没有把人划入粗略的祖源类别,而是将每个人放在一个连续的“遗传距离”尺度上:即在基于主成分的基因图谱中,每个人的 DNA 特征与 GWAS 平均参与者之间的距离。

预测能力减弱——但并非简单或公平的模式

在这个遗传距离尺度上,出现了一些熟悉的模式。例如对身高而言,群体层面的预测准确性随着人与 GWAS 群体在遗传上的远离而平滑下降。然而,当研究者放大到个体层面时,遗传距离仅能解释预测好坏的一小部分差异。社会经济测量指标,例如汤森德贫困指数(Townsend Deprivation Index,一种反映社区物质匮乏程度的指标),在解释谁会得到较差预测方面的表现大致相当或略好。换言之,即使在相同的遗传距离带内,社会经济地位较低的人通常会得到较不准确的基因预测,这突出表明社会环境在评分是否有用方面与 DNA 一样重要。

不同性状、不同历史、不同结论

并非所有性状表现相同。对于体重和体脂,预测准确性实际上在中等遗传距离处达到了峰值,随后才下降,打破了“越远越差”的简单模式。与免疫相关的性状,例如白细胞和淋巴细胞计数,表现尤其令人费解。对于部分此类性状,即便人群在遗传上与 GWAS 样本并非非常遥远,群体层面的预测准确性也降至几乎为零。作者指出,免疫性状可能受快速变化的进化压力(如过去的感染史)影响——这些因素会改变在不同人群中重要的 DNA 变异。在这些情况下,遗传架构本身可能已经发生足够的变化,使得基于一组人建立的评分在另一组人中几乎无用。

Figure 2
Figure 2.

我们如何衡量表现会改变结论

当我们改变“良好预测”的衡量方式时,情形变得更加复杂。此前许多研究依赖一个名为 R² 的统计量来捕捉评分在群体中解释性状变异的比例。作者展示了其他指标可能讲述不同的故事,尤其是对疾病而言。以哮喘为例,精确率(预测为病例中实际为病例的比例)和召回率(实际病例中被发现的比例)都随遗传距离下降呈相似趋势。但对 2 型糖尿病而言,精确率保持相对稳定,而召回率反而随着距离增加而上升——这意味着该评分在更远群体中找到了更大比例的真实病例,即便它是在一个较近的群体中构建的。取决于诊所是更重视发现所有高风险患者,还是更在意避免误报,人们可能对评分的可迁移性得出截然相反的结论。

这对在现实中使用 DNA 评分意味着什么

总体而言,该研究主张不能仅通过查看粗略的祖源标签或单一准确性数字来判断多基因评分的有用性。个体预测质量取决于多种因素的混合:细微的遗传相似性模式、每种性状的进化历史、个人所处的环境与社会条件,以及评分和其性能度量的具体选择。要让多基因评分在医学中被公平且有效地应用,研究者需要更好的方法来捕捉细颗粒度的遗传结构、对社会与环境影响建模,并将评估指标与现实决策相匹配。在此之前,应谨慎使用遗传风险评分,并关注它们在何种人群和情境下表现不佳以及表现良好。

引用: Wang, J.Y., Lin, N., Zietz, M. et al. Three open questions in polygenic score portability. Nat Commun 17, 942 (2026). https://doi.org/10.1038/s41467-026-68565-3

关键词: 多基因评分, 基因预测, 健康差距, 遗传祖源, 精准医学