Clear Sky Science · zh

使用 PGS-hub 平台对单一与多祖源多基因评分方法进行全面基准测试

· 返回目录

你的 DNA 风险评分为何重要

医生越来越擅长解读我们的 DNA,以评估谁更可能罹患心脏病、糖尿病或精神分裂症等常见疾病。这些估计称为多基因评分,把许多基因变体的微小效应合并为一个数值。但现在有许多不同的方法来计算这类评分,并且这些方法对不同祖源背景的人效果并不相同。本研究旨在将领先方法逐一比较,并构建一个在线服务 PGS-hub,使研究者能够以一致且简便的方式计算这些评分。

一站式的 DNA 风险计算平台

作者创建了 PGS-hub,这是一个将多基因评分技术复杂性隐藏在背后的网络平台。用户上传汇总了数百万个 DNA 标记与某疾病或性状关系的遗传研究结果。然后选择他们关心的人群祖源背景——例如欧洲或非洲——并从流行的评分方法菜单中选择。PGS-hub 在后台将输入转换为正确格式,接入预先构建的参考面板以描述相邻 DNA 标记之间的相关性,并在高性能计算系统上运行大量任务。输出是一个紧凑的权重文件,可应用于个体基因组以为每个人生成评分。

Figure 1
Figure 1.

对 13 种评分方法的检验

为了评估哪些方法效果最佳,团队在近 38 万名欧洲祖源个体和略超 8,000 名非洲祖源个体(均来自英国生物样本库)中,对 36 种疾病和性状比较了 13 种最先进的方法。他们不仅评估每种评分预测疾病或更高性状值的效果,还衡量每种方法消耗的计算时间和内存。在欧洲人群中,一种名为 LDpred2 的方法通常提供了最准确的评分,往往明显优于其他方法。少数替代方法——如 lassosum2、PRS-CS 和 SDPR——在许多性状上表现几乎相当,而一些较旧的方法则落后。对于身高或克罗恩病等性状,最佳评分解释了相当一部分遗传风险;而对肾功能等性状,所有方法都表现不佳,反映出较弱的潜在遗传信号。

面向多样化人群与组合方法的见解

遗传预测的一大担忧是,主要在欧洲人群中训练的方法可能无法很好地转移到具有不同祖源的人群。当作者用非洲祖源的遗传研究重复基准测试时,每种方法的表现都更差,这凸显了这些人群中大型研究的匮乏。不过,LDpred2 和 SDPR 往往仍是较好的选择。团队还考察了明确跨人口整合信息的“多祖源”方法。在这里,一种相对简单的策略——将最佳的祖源特异性 LDpred2 评分线性组合成单一的 LDpred2-multi 评分——在欧洲和非洲人群中均优于更复杂的多祖源模型,如 PRS-CSx 和 X-Wing。此外,作者展示了构建集合模型(将来自多种方法的最强评分融合)能进一步提升所有性状的预测效果,尤其是对于高度遗传的疾病,如精神分裂症和冠状动脉疾病。

Figure 2
Figure 2.

数据选择与计算资源如何影响评分

研究还探讨了参考面板规模——用于学习相邻 DNA 标记如何协变的人群样本——如何影响性能。当该面板非常小(少于 1,000 人)时,评分的准确性明显下降。随着面板增长到大约 5,000 人,性能显著提升然后趋于平缓,表明更大规模的面板收益递减。令人意外的是,仅仅加入更多的 DNA 标记并不总是有益:使用大约 660 万个变体有时比使用精心挑选的约 110 万个变体的预测效果更差,可能是因为额外的标记带来了比有用信号更多的噪声。作者还记录了计算成本的巨大差异。像基本的剪枝-阈值(pruning-and-thresholding)等简单方法每个性状在一小时内完成,而一些贝叶斯方法则需要数百个 CPU 小时——这些信息对大型项目或资源有限的团队很重要。

这对未来基于 DNA 的预测意味着什么

对非专业读者来说,核心信息是:并非所有 DNA 风险评分都相同,构建细节会强烈影响谁能从中受益。本研究提供了实用指导:如 LDpred2 及设计良好的集合模型在大型欧洲数据集中往往能给出最可靠的预测,而多祖源组合有时能优于更复杂的跨群体模型。与此同时,非洲祖源个体准确性下降凸显了开展更大且更多样化遗传研究的紧迫需求。通过将多种方法打包到单一、标准化的在线平台中,PGS-hub 降低了全球研究者生成和比较多基因评分的门槛,这是朝着公平且有效地在医学中使用此类评分迈出的重要一步。

引用: Chen, X., Wang, F., Zhao, H. et al. Comprehensive benchmarking single and multi ancestry polygenic score methods with the PGS-hub platform. Nat Commun 17, 2014 (2026). https://doi.org/10.1038/s41467-026-68599-7

关键词: 多基因评分, 遗传风险预测, PGS-hub 平台, 多祖源基因组学, 英国生物样本库