Clear Sky Science · zh

通过建模分位数特异性遗传效应来增强多基因风险预测

2026-04-06 · 返回目录

为什么预测遗传风险比看起来更难

遗传风险评分承诺能告诉我们谁更容易罹患糖尿病或心脏病等疾病，但现有工具大多假定基因以相同的、简单的方式推动每个人的风险。然而许多真实性状并不对称：大多数人的数值在正常范围，而一小部分落在高风险尾部。本研究引入了一种新的构建遗传风险评分的方法，它不仅关注平均个体，而是考察基因在整个结果分布上的行为，尤其是对健康决策最重要的高风险尾部。

超越平均个体的视角

标准的多基因风险评分将数百或数千个 DNA 变体的微小效应相加，以估计个体对某一性状或疾病的总体遗传易感性。这些评分通常基于关注群体平均结果的方法。当性状大致对称时（例如许多群体中的身高），这种方法效果很好。但对葡萄糖和甘油三酯等血液指标而言，分布是偏斜的：大多数人聚集在健康水平，而少数人具有显著更高的数值。之前的研究提示，一些遗传变体主要影响极端值而非中间值，这意味着单一的“基于平均值”的评分可能错过重要信号。

在整个谱系上评分遗传风险的新方法

研究者们开发了一种称为基于分位数的多基因风险评分（QPRS）的方法。QPRS 不再为每个 DNA 变体估计一个固定的遗传效应，而是衡量该效应在性状分布多个点位（从低到高）上如何变化。从技术上讲，这使用了分位回归，它建模的是性状的第 10、50 或 90 百分位等，而不仅仅是均值。对每个百分位，研究团队进行全基因组扫描以估计变体效应，使用常规过滤工具选择有信息量的变体，并构建单独的风险评分。然后将这些针对不同百分位的多个评分一起输入预测模型，使最终风险估计反映了在分布不同部分起作用的遗传影响。

用模拟和真实基因组测试该方法

为了评估 QPRS 何时有效，作者首先使用来自大型韩国队列的真实遗传数据进行受控模拟。在一组情景中，一些遗传变体被设计为改变性状的变异幅度而非其平均水平，模拟主要影响分布尾部的变体。在这种设置下，QPRS 比传统评分更准确地预测性状的低百分位和高百分位，显著减少了预测误差，特别是在性状值噪声较大或强烈偏斜时。它还更好地恢复了真正有影响的变体，表明对整个分布建模可以发现基于均值的方法忽视的信号。在另一组受极端离群值困扰的模拟中，QPRS 通常比标准方法更稳健，但在非常严重的失真情况下，一种更简单的以中位数为核心的方法表现最佳。

关于血脂和血糖的数据说明

研究团队随后将 QPRS 应用于来自韩国基因组与流行病学研究中 8000 多名成年人的真实数据，重点关注负荷后血糖和血甘油三酯，这两者都是代谢健康的重要指标。这些性状呈明显的右偏，具有明显的高风险长尾。在甘油三酯方面，QPRS 明显优于多种流行评分方法，无论单独使用还是与年龄、体重指数和吸烟状况等临床因素结合使用。对于血糖，在考虑临床因素后整体遗传信号较弱，收益较为温和但仍可见，尤其是在将 QPRS 添加到传统评分之上时。分析还发现了若干个体遗传变体，其效应在血糖分布的低位与高位之间发生翻转或强度变化——这些模式单一的基于平均值的估计大多会掩盖。

对遗传风险预测的意义

这项工作表明，将遗传风险视为与平均结果绑定的单一数值，对分布不对称或高度可变的性状可能具有误导性。通过明确建模遗传效应在性状全谱系上的差异，QPRS 提高了风险预测的精确性，特别是对临床最为关注的高风险尾部人群。它还提供了基因如何塑造疾病相关性状的更丰富图景，突出了对极端值特别重要的变体。长期来看，将传统的基于均值的评分与像 QPRS 这样的分位数敏感方法结合，可能为个体化医疗带来更细化、更具信息性的遗传风险工具。

引用: Kim, S., Goo, T., Park, T. et al. Enhancing polygenic risk prediction by modeling quantile-specific genetic effects. Sci Rep 16, 11749 (2026). https://doi.org/10.1038/s41598-026-47082-9

关键词: 多基因风险评分, 分位回归, 遗传预测, 血脂, 2 型糖尿病