Clear Sky Science · zh
通过机器学习对肿瘤浸润性淋巴细胞的自动量化揭示肺癌的预后和免疫基因组特征
为什么在肺肿瘤中计数微小免疫细胞很重要
肺癌仍然是最致命的癌症之一,但并非所有肿瘤的行为都相同。有些肿瘤被大量渗入的免疫细胞巡逻并进入肿瘤组织,而另一些则几乎不受免疫系统触及。这些肿瘤浸润性淋巴细胞(TILs)可以提示患者的预后以及是否可能从现代免疫治疗药物中受益。问题是,目前TIL的计数通常依靠显微镜下的人工目测,既耗时又带有主观性。本研究提出了一个及时的问题:我们能否使用机器学习在常规病理切片上自动测量这些细胞,以及这能揭示关于肺癌生物学和患者生存的哪些信息?

将普通切片变成数字化地图
研究人员聚焦于肺腺癌这一常见类型,使用来自癌症基因组图谱(The Cancer Genome Atlas)的公开数据以及来自其所在医院的独立患者队列。对每位患者,他们分析了标准的苏木精-伊红(H&E)染色组织切片,那些病理学家都非常熟悉的粉紫色图像。借助开源软件QuPath,他们建立了分步管线:首先校正切片间的颜色差异;接着使用分水岭算法分离重叠的细胞核;最后,用训练好的计算分类器将检测到的每个细胞标记为肿瘤细胞、支持性组织(基质)或淋巴细胞。两位资深病理学家反复审查并校正机器的结果,直到系统能够可靠地自行识别不同的细胞类型。
将免疫细胞计数与患者结局联系起来
一旦系统可以自信地识别细胞,团队计算了超过300名患者的每平方毫米肿瘤组织中有多少淋巴细胞。他们发现TIL水平差异很大,平均只占所有细胞的一小部分。通过统计学方法寻找最具信息量的截断点,他们选择每平方毫米135个TIL作为“高”与“低”TIL肿瘤的分界线。跨过该阈值的患者比免疫细胞稀少的患者存活期更长,这种模式在原始队列和验证队列中均得到维持。换言之,一个由自动化工具产生的简单数值捕捉到了有意义的生存差异,这与早期依赖人工计数的更费力的研究结果相呼应。

免疫丰富的肿瘤在分子层面是什么样子
由于许多肿瘤有基因和分子数据,作者得以探究除了细胞计数之外,高TIL与低TIL肿瘤的区别。淋巴细胞丰富的肿瘤显示出更强的免疫活性特征:涉及识别异常蛋白、向T细胞呈递抗原以及协调免疫攻击的基因表达都更为活跃。这些肿瘤也携带更广泛的DNA突变混合,可能产生免疫系统的新靶点。相比之下,低TIL肿瘤更偏向于与核糖体构建和蛋白质合成相关的基因,这表明其增长机制活跃但免疫参与较少。这种分裂反映了如今常见的“热”肿瘤(免疫细胞丰富、更可能对免疫治疗有反应)与“冷”肿瘤(免疫系统几乎忽视)的对比。
教计算机预测免疫状态
团队更进一步,探讨是否可以用一组紧凑的图像特征在不逐一计数每个淋巴细胞的情况下就预测肿瘤属于高TIL还是低TIL。他们将切片中细微的纹理模式——像素强度在小邻域内如何变化——总结为所谓的Haralick特征,并将这些特征与肿瘤的临床分期一起输入随机森林模型。在交叉验证中,该分类器以较高的准确度正确区分了高TIL与低TIL肿瘤,并在独立的医院队列中保持了合理的性能。重要的是,整个方法可在标准计算机上运行,使用免费软件,这意味着许多病理实验室原则上无需专用硬件即可采用该方法。
这对未来肺癌护理意味着什么
对非专业读者而言,关键信息是计算机可以学习读取常规肺癌切片,并以可量化的方式反映出免疫系统与肿瘤的互动强度。高水平的浸润性淋巴细胞意味着更积极的免疫反应、更丰富的突变景观以及更好的整体生存率。尽管还需更多工作——尤其是在接受免疫治疗的患者中——这种自动化方法最终可能帮助医生快速且一致地将肿瘤归类为免疫“热”或“冷”。这反过来可能指导谁最有可能从免疫类治疗中受益,并激发将冷肿瘤转变为热肿瘤的新策略。
引用: Li, A., Pang, Y., Zhang, H. et al. Automated quantification of tumor-infiltrating lymphocytes by machine learning reveals prognostic and immunogenomic features in lung cancer. Sci Rep 16, 7006 (2026). https://doi.org/10.1038/s41598-026-37076-y
关键词: 肺腺癌, 肿瘤浸润性淋巴细胞, 机器学习, 数字病理, 癌症免疫治疗