Clear Sky Science · zh

循环肿瘤DNA数据的整合可提升慢性阻塞性肺病患者的肺癌预测能力

· 返回目录

这对慢性肺病患者为何重要

患有慢性阻塞性肺病(COPD)的人发展成肺癌的风险明显更高,但在已经受损的肺部中早期发现癌症非常困难,通常需要有风险的活检。本研究探讨了一种是否可行的方法:将可以捕捉肿瘤DNA微片段的简便血液检测与现代计算算法相结合,来更准确地识别哪些COPD患者最可能患有肺癌——并朝着有一天可能避免部分患者接受侵入性检查的方向前进。

在血流中寻找癌症线索

当癌细胞增殖时,会向血液中释放DNA片段,称为循环肿瘤DNA。研究人员从236名中度COPD患者采集血样,其中约一半已有肺癌,另一半没有。研究并非对整个基因组进行筛查,而是聚焦于24个在肺肿瘤中常见发生改变的基因。通过高灵敏度测序方法,他们在每份血样中扫描特征性突变,同时测量突变DNA的丰度以及该信号相对于背景噪声的显著度。

Figure 1
Figure 1.

将智能算法加入传统风险因素

除了血液检测外,团队为每位参与者收集了详尽的临床信息,包括年龄、性别、吸烟史、肺功能、血液炎症标志物以及呼吸症状问卷。他们随后将40项信息——临床指标加上来自血液的基因组与分子特征——输入到九种不同的机器学习模型中。这些模型包括常见的统计方法以及更灵活的模式识别方法,能够检测变量间的微妙非线性关系。目标很明确:教会计算机区分有肺癌的COPD患者与无肺癌的患者。

将癌症患者区分开的要点

两组之间出现了若干明显差异。患有肺癌的COPD患者更可能为重度吸烟者,且C反应蛋白(水准较高)——一种与慢性炎症相关的血液标志物——水平更高。令人意外的是,他们报告的COPD症状往往比无癌患者少,这可能反映了两组就诊时机或就诊方式的不同。在DNA层面,差异更为显著:血液中与肿瘤相关的突变以及经典的肺癌“驱动”基因突变——尤其是知名的抑癌基因TP53——在有癌症者中出现频率更高,并且其肿瘤DNA片段在测序数据中表现出更强的分子证据。

包含DNA数据时预测更强

当研究人员仅使用传统临床信息训练模型时,预测准确性较为有限。但当他们加入肿瘤DNA信号和相关分子测量时,性能显著提升,尤其是在更灵活的非线性模型中。表现最好的模型是径向支持向量机,它显示出更高的敏感性(发现更多真实的癌症病例)、更好的假阳性与假阴性之间的平衡,以及更大的曲线下面积(AUC,衡量整体准确性的标准)。重要的是,在这个结合模型中,最具影响力的预测因子不再仅仅是吸烟和炎症,还包括肿瘤DNA突变的存在、测序信号的强度以及TP53的突变。

Figure 2
Figure 2.

这对患者可能意味着什么

该研究表明,将血液抽取得到的肿瘤DNA信号融入预测工具,可以帮助医生更准确地判断哪些COPD患者更可能存在肺癌。尽管这种方法尚不足以替代低剂量CT或作为独立的筛查检测,但它可用于解读不确定的影像学发现、减少对肺部脆弱患者的不必要侵入性活检,并将更密切的随访集中在风险最高的人群。还需要更大规模、更具多样性的研究和更广泛的DNA检测面板,但这项工作指向了这样一种未来:通过先进算法解读的一次简单血样,能够为COPD患者提供更安全、更个性化的肺癌评估指导。

引用: Cha, S., Shin, S.H., Shin, SH. et al. Integration of circulating tumor DNA data enhances lung cancer prediction in patients with COPD. Sci Rep 16, 11806 (2026). https://doi.org/10.1038/s41598-026-41720-y

关键词: 慢性阻塞性肺病, 肺癌, 循环肿瘤DNA, 液体活检, 机器学习