Clear Sky Science · zh
基于血清代谢指纹的集成学习用于早期肺腺癌检测
为什么早期检测肺癌很重要
肺腺癌是最常见的肺癌类型,常常在多年内悄然生长而不引起症状。等到被发现时,通常已难以治疗。当前的主要筛查工具低剂量CT常常发现一些很小的肺结节,而这些结节多数并非癌症,导致焦虑、反复检查,有时还会造成不必要的手术。本研究考察了一种简单的血液检测结合现代机器学习是否能帮助识别早期肺癌,并将危险的病变与较不令人担忧的病变区分开来。
在血样中读取癌症线索
研究者关注的是在血液中循环的小分子代谢物,这些分子反映了细胞如何利用和转化能量。他们收集了199名受试者的血清样本:包括健康志愿者以及从癌前结节到微浸润与浸润性肿瘤等不同早期阶段的患者。通过高分辨率质谱,他们对每个样本中近千种不同的代谢物进行了无偏快照,描绘出随着癌症发展人体化学状态如何广泛改变的图景。

随着肿瘤生长体内化学如何变化
当团队比较四组样本的化学指纹时,出现了清晰的模式。许多与胆汁酸、脂类、氨基酸以及DNA和RNA构建模块相关的物质,从健康个体到癌前病变再到浸润性肿瘤呈逐步变化。有些代谢物持续升高,有些持续下降,还有少数在中间阶段达到峰值或谷值。这些阶梯式的变化表明,早期肺部病变患者的血液化学在癌症进展为晚期之前就已被重塑,为若能捕捉到合适信号提供了更早检测的机会。
教算法识别癌症指纹
因为没有单一代谢物能说明全部情况,研究者转向集成机器学习——一种将多种预测模型组合为更稳健判定器的方法。他们首先通过统计检验和一种偏好最强且冗余最少信号的特征选择方法,缩小候选代谢物列表。选定的标志物随后被输入到AutoGluon,这是一种构建并融合多种模型(如决策树和梯度提升机)的软件框架,用以将样本分类为健康或患病,并区分不同疾病阶段。

小型分子面板却具备强大诊断能力
该机器学习流程产出了几组紧凑的代谢物组合,整体携带着强有力的诊断信息。一组由六种血中分子组成的面板几乎可以完美地区分研究队列中的健康者与所有具有肺部病变的病人,包括最早期的肿瘤。另一组六分子面板专门用于检测浸润性I期癌,其准确性可与甚至优于许多现有的基于代谢物的检测。另有一组四分子面板能将癌前结节与已侵入性疾病区分开来——这是临床上尤其重要的问题,因为它影响外科医生是建议密切随访还是采取更积极的手术方案。
这对患者可能意味着什么
尽管这一工作需要在更大且更多样化的患者群体中得到验证,但它指向一种前景:通过常规抽血就可帮助识别那些确实危险的肺结节,同时让其他人免受不必要的程序。通过捕捉伴随肿瘤早期形成的微妙化学变化,并用强大且可解释的算法加以解读,该研究为可补充CT扫描的微创工具奠定了基础,有助于指导治疗选择,并最终在肺腺癌最易治愈的阶段实现早发现。
引用: Cai, C., Xu, W., Yang, S. et al. Ensemble learning on serum metabolic fingerprints for early detection of lung adenocarcinoma. npj Precis. Onc. 10, 149 (2026). https://doi.org/10.1038/s41698-026-01342-z
关键词: 肺腺癌, 血清代谢组学, 早期癌症检测, 机器学习 生物标志物, 无创诊断