Clear Sky Science · zh
基于临床实验室数据的早期恶性肺结节诊断模型
为何肺部微小斑点很重要
当一次常规胸部扫描发现肺部有小斑点时,医生和患者面临一个艰难的问题:这是需要尽快治疗的早期癌症,还是可以安全观察的良性改变?现有影像检查常常无法区分两者,导致有些人接受了不必要的手术,而另一些人则可能延误危险的诊断。该研究探讨了是否可以通过一种简单的血液检测,结合现代计算技术,帮助将这些肺部“结节”分为低风险和高风险两类。
当下扫描和血检的局限
低剂量CT扫描现已广泛用于肺癌高危人群筛查,因为它能在肿瘤仍很小时就发现病灶。但这些扫描也会发现大量良性结节,几乎所有阳性发现中很大一部分并非癌症。临床常用的传统血液标志物并未解决这一问题;它们往往漏诊许多早期癌症,单靠这些标志物无法可靠地指导决策。因此,医生常常高度依赖经验和影像中的细微信息,而这些判断在不同专家间可能存在差异。
把免疫“指纹”变成线索
一个有前景的思路是观察机体自身的免疫反应。早在肺肿瘤大到影像可见之前,免疫系统可能已识别出来自癌细胞的异常蛋白并产生相应抗体。一组七种此类自身抗体已在中国获批,被认为对肺癌具有较高特异性,但仍会漏诊许多病例。本研究的研究者们提出,是否将这套抗体指标与常规血液化验结果结合——这些结果可由标准抽血获得——能够更全面地反映癌症风险。

教计算机识别模式
团队分析了310例经组织学确诊的肺结节患者数据:142例为早期癌症,168例为瘢痕或炎症等良性病变。对每位患者,他们收集了七种自身抗体、性别等基本信息以及一系列常规血液检查结果,包括血细胞、蛋白质和炎症指标。研究者使用统计方法剔除较少用的信息,将变量筛减至12项关键因素。随后,他们训练并比较了11种不同的机器学习方法——这类算法通过示例学习模式,而非依赖固定公式。
为临床打造的精简模型
在所有测试的方法中,一种称为随机森林的方法在独立患者组上的准确性和稳定性之间表现最佳。为了让未来的检测更具实用性,研究者使用解释性工具查看哪些输入对模型决策贡献最大。这使他们能将模型缩减到仅五项血液特征:一种常见的凝血蛋白纤维蛋白原和四种自身抗体,分别为p53、SOX2、MAGE A1和GBU4-5。即便在这一精简形式下,与完整的12因子版本相比,模型区分恶性与良性结节的额外能力几乎未丧失。

该工具可能的使用方式
在测试中,该模型展示了较强的能力,能在保持高特异性的同时正确识别许多真实的癌症,这意味着模型判定为低风险的结节大多数确属良性。然而,其敏感性——即检测到的癌症比例——约为三分之二,低于可作为独立筛查检测的要求。作者建议其可作为决策中的“辅助之声”:帮助医生识别那些极不可能为癌症、可能可以暂缓侵入性操作的患者,同时仍以影像学和临床判断为最终决策依据。
这对患者意味着什么
这项研究提供了概念验证:来自常规抽血的已有信息,经由经过校验的机器学习模型解读后,能够帮助澄清肺结节为恶性的风险。作者甚至建立了一个网页版计算器,便于其他团队验证该方法。目前这项工作仍属试验性:研究在单一医院开展,样本量有限,且主要针对一种肺癌类型。需要更大规模、多中心的研究来证明该模型在日常临床中是否真正改善护理并足够可靠。如果后续验证成功,此类工具可望减少不必要手术,将关注集中于更需要治疗的患者,并使发现小肺斑点时的恐惧有所减轻。
引用: Liu, L., Li, H., Miao, Y. et al. Diagnosis model of early malignant pulmonary nodules based on clinical laboratory data. Sci Rep 16, 12172 (2026). https://doi.org/10.1038/s41598-026-42111-z
关键词: 肺癌, 肺结节, 自身抗体, 机器学习, 血液生物标志物