Clear Sky Science · zh

通过建模分位数特异性遗传效应来增强多基因风险预测

· 返回目录

为什么预测遗传风险比看起来更难

遗传风险评分承诺能告诉我们谁更容易罹患糖尿病或心脏病等疾病,但现有工具大多假定基因以相同的、简单的方式推动每个人的风险。然而许多真实性状并不对称:大多数人的数值在正常范围,而一小部分落在高风险尾部。本研究引入了一种新的构建遗传风险评分的方法,它不仅关注平均个体,而是考察基因在整个结果分布上的行为,尤其是对健康决策最重要的高风险尾部。

超越平均个体的视角

标准的多基因风险评分将数百或数千个 DNA 变体的微小效应相加,以估计个体对某一性状或疾病的总体遗传易感性。这些评分通常基于关注群体平均结果的方法。当性状大致对称时(例如许多群体中的身高),这种方法效果很好。但对葡萄糖和甘油三酯等血液指标而言,分布是偏斜的:大多数人聚集在健康水平,而少数人具有显著更高的数值。之前的研究提示,一些遗传变体主要影响极端值而非中间值,这意味着单一的“基于平均值”的评分可能错过重要信号。

Figure 1
Figure 1.

在整个谱系上评分遗传风险的新方法

研究者们开发了一种称为基于分位数的多基因风险评分(QPRS)的方法。QPRS 不再为每个 DNA 变体估计一个固定的遗传效应,而是衡量该效应在性状分布多个点位(从低到高)上如何变化。从技术上讲,这使用了分位回归,它建模的是性状的第 10、50 或 90 百分位等,而不仅仅是均值。对每个百分位,研究团队进行全基因组扫描以估计变体效应,使用常规过滤工具选择有信息量的变体,并构建单独的风险评分。然后将这些针对不同百分位的多个评分一起输入预测模型,使最终风险估计反映了在分布不同部分起作用的遗传影响。

用模拟和真实基因组测试该方法

为了评估 QPRS 何时有效,作者首先使用来自大型韩国队列的真实遗传数据进行受控模拟。在一组情景中,一些遗传变体被设计为改变性状的变异幅度而非其平均水平,模拟主要影响分布尾部的变体。在这种设置下,QPRS 比传统评分更准确地预测性状的低百分位和高百分位,显著减少了预测误差,特别是在性状值噪声较大或强烈偏斜时。它还更好地恢复了真正有影响的变体,表明对整个分布建模可以发现基于均值的方法忽视的信号。在另一组受极端离群值困扰的模拟中,QPRS 通常比标准方法更稳健,但在非常严重的失真情况下,一种更简单的以中位数为核心的方法表现最佳。

Figure 2
Figure 2.

关于血脂和血糖的数据说明

研究团队随后将 QPRS 应用于来自韩国基因组与流行病学研究中 8000 多名成年人的真实数据,重点关注负荷后血糖和血甘油三酯,这两者都是代谢健康的重要指标。这些性状呈明显的右偏,具有明显的高风险长尾。在甘油三酯方面,QPRS 明显优于多种流行评分方法,无论单独使用还是与年龄、体重指数和吸烟状况等临床因素结合使用。对于血糖,在考虑临床因素后整体遗传信号较弱,收益较为温和但仍可见,尤其是在将 QPRS 添加到传统评分之上时。分析还发现了若干个体遗传变体,其效应在血糖分布的低位与高位之间发生翻转或强度变化——这些模式单一的基于平均值的估计大多会掩盖。

对遗传风险预测的意义

这项工作表明,将遗传风险视为与平均结果绑定的单一数值,对分布不对称或高度可变的性状可能具有误导性。通过明确建模遗传效应在性状全谱系上的差异,QPRS 提高了风险预测的精确性,特别是对临床最为关注的高风险尾部人群。它还提供了基因如何塑造疾病相关性状的更丰富图景,突出了对极端值特别重要的变体。长期来看,将传统的基于均值的评分与像 QPRS 这样的分位数敏感方法结合,可能为个体化医疗带来更细化、更具信息性的遗传风险工具。

引用: Kim, S., Goo, T., Park, T. et al. Enhancing polygenic risk prediction by modeling quantile-specific genetic effects. Sci Rep 16, 11749 (2026). https://doi.org/10.1038/s41598-026-47082-9

关键词: 多基因风险评分, 分位回归, 遗传预测, 血脂, 2 型糖尿病