Clear Sky Science · zh
用于肺癌发生风险评估的多基因评分现状:系统综述与英国生物样本库中的验证
为什么我们的基因与肺癌相关
肺癌通常与吸烟有关,但并非所有吸烟者都会罹患肺癌,也有不吸烟的人会患病。这一现象促使科学家探究:肺癌风险有多少隐藏在我们的DNA中。本文考察了将许多微小的遗传线索合并为所谓的多基因评分(polygenic scores),是否能在已知的烟草暴露之外,帮助识别出最有可能发展为肺癌的人群。

寻找遗传线索
研究者已不再期望存在单一的“肺癌基因”。相反,风险来自于许多微妙的DNA差异的综合效应。这些散布在全基因组的微小变异,每一处都或多或少改变风险。通过将数百甚至数千个这类变异累加成一个数值——多基因评分——科学家希望估计个体遗传上倾向于罹患肺癌的程度。如果此类评分表现良好,将来可能有助于决定谁应接受早期筛查影像,即便是在那些从未吸烟的人群中。
汇集现有的所有评分
作者首先对科学文献和一个公开的遗传风险评分数据库进行了广泛检索。他们发现自2012年以来已有60种不同的肺癌多基因评分被提出,这些评分大多基于欧洲人和东亚人群的大规模遗传研究。各评分在所纳入的变异数量、构建方法以及是否考虑吸烟等方面存在差异。有些评分仅在其构建的样本中进行了检验,只有少数在完全独立的人群中得到验证。
将这些评分付诸检验
为了公平比较这些评分,研究团队使用了英国生物样本库(UK Biobank),这是一个拥有约50万成年人的遗传数据和长期健康记录的大型研究。在排除已有癌症的参与者后,他们随访了超过429,000名受试者,其中有超过3,500人在随后患上了肺癌。研究人员能够在该队列中重建并测试39种已发表的评分。对每位参与者,他们计算了多基因评分,并使用常用的预测性能指标检验这些评分将来能否将未来发病者与未发病者区分开来。

结果真正表明了什么
大多数被测试的评分确实与未来的肺癌存在一定关联,即得分更高的人被诊断为肺癌的比例较高。然而,这种预测能力是有限的。用技术语言来说,几乎所有评分的预测性能都优于随机,但远低于在乳腺癌或结直肠癌等其他癌症中观察到的相似评分的准确度。即使是表现最好的肺癌评分,也无法将超过大约2%的未来病例集中到遗传风险分布的前1%。通过增加更多标记或采用更新的方法增加复杂度,并未显著提升预测效果。
按吸烟史和祖源的差异
由于吸烟是强有力的风险因素,研究者还考察了这些评分在不同吸烟史人群中的表现。大多数评分在当前和既往吸烟者中预测略好于从未吸烟者,这暗示许多遗传标记可能部分反映了倾向吸烟的行为。有意思的是,一小部分评分在从未吸烟的人中表现相对更好,这提示这些特定的DNA模式可能更多捕捉到与肺癌发生相关的基础生物学倾向。研究还强调了一个严重的不平衡:大多数原始遗传研究基于欧洲或东亚血统的人群,对其他族裔组别的性能了解甚少。
这对未来筛查意味着什么
对普通读者来说,核心信息是:现有的肺癌遗传评分尚不足以单独用作筛查工具。它们可以在一定程度上将高风险与低风险人群区分开来,尤其是在吸烟者中,但差异太小,无法可靠地识别出谁将患肺癌。作者得出的结论是,目前这些评分可能最有用的做法是作为更广泛风险模型中的一个组成部分,该模型还应包括年龄、吸烟史以及其他健康或环境因素。他们还强调,需要更多多样化的遗传研究,并更好地理解基因与吸烟之间的相互作用,才能在对谁以及何时进行筛查上让遗传风险产生实质性影响。
引用: Galal, B., Dennis, J., Antoniou, A.C. et al. The current state of polygenic scores for the development of lung cancer: a systematic review and validation in UK Biobank. Br J Cancer 134, 939–948 (2026). https://doi.org/10.1038/s41416-025-03330-9
关键词: 肺癌风险, 多基因评分, 遗传易感性, 吸烟与遗传学, 癌症筛查