Clear Sky Science · zh
在21种肿瘤类型中对组织病理学分割模型跨癌种泛化能力的全面评估
更聪明的癌症诊断助手
在显微镜下研究组织的病理学家越来越依赖计算程序来发现癌变并精确测量。但为每一种癌症都构建独立工具需要数月的专家工作。此研究提出了一个简单却具有重要实用意义的问题:为一种癌症训练的高质量工具是否可以安全地重复用于许多其他癌症,从而节省时间并加速数字化辅助在临床中的应用? 
为什么要在切片上标注癌变很重要
病理学家审视组织切片时,不仅仅判断是否存在癌症。他们要仔细描绘肿瘤与健康组织之间的边界,评估细胞的排列方式,并测量诸如瘢痕状组织、坏死区和免疫细胞等特征。现代人工智能可以通过为切片上的每个像素着色来模拟这一过程。这种像素级映射支持研究肿瘤如何生长,帮助量化人类难以测量的微妙模式,并可用于将组织结构与基因或药物反应数据相连接的新型检测方法。
每癌一种模型的挑战
创建此类细致工具既缓慢又费力。专家必须在许多大图像上绘制肿瘤及其周围组织的精确轮廓,这项工作每例可能需要数小时。对于每种新癌症,通常需重新训练并测试一款新模型以确保安全性与准确性,这往往需要多年并跨多家医院进行。面对数十种常见肿瘤,“每癌一种模型”的做法成为严重瓶颈。它限制了人工智能迅速进入常规护理的速度,也使构建广泛可用系统变得更加困难。
测试模型能否跨越癌种边界
研究人员选取了五个原本分别为乳腺、结肠、肺、肾和前列腺癌训练的组织分割模型。他们将这些模型应用于来自癌症基因组图谱(The Cancer Genome Atlas)项目的21种不同肿瘤类型的超过7700张数字切片。对于每张切片,一名病理学家选取了一个富含肿瘤的大区域,并在可能的情况下选取一个良性组织区域。模型对这些区域中的每个像素按组织类型着色。随后病理学家以0到10的简单评分尺度评估每个模型将肿瘤与其基质组织分离的效果,得分越高表示轮廓越准确、遗漏结构越少。 
哪些模型在跨癌种上表现最好
结果显示肺癌模型最为通用。其在所有肿瘤类型上的平均得分约为8分(满分10分),并且在被测试的非肺癌中,有超过一半达到了“优秀”质量,包括卵巢肿瘤、胆管肿瘤、甲状腺癌以及若干由扁平鳞状细胞构成的癌症。在许多这些情形中,其性能与在原始肺切片上的表现相当。乳腺和结肠模型也在多种其他癌症上表现良好,但没有肺模型那么广泛。肾和前列腺模型因在形态上更具特异性的肿瘤上训练,泛化性较差,尤其对于显微形态差异较大的癌种更不稳定。
解释良好泛化的模式
研究揭示,成功或失败主要与肿瘤间细胞形态和生长模式的相似性有关。例如,肺模型学习到了肺癌中的腺形成和鳞状生长两种模式,因此在头颈部、子宫颈和食管的鳞状癌上也能良好工作。乳腺模型在识别一种称为浸润性小叶癌的亚型中分散的单个细胞方面受过训练,因此在由类似松散小细胞簇构成的弥漫性胃癌中也表现有效。相比之下,具有异常外观的肿瘤,如许多肾癌和黑色素瘤,对所有模型来说都更难识别。即便如此,这些工具在良性区域(如正常腺体或早期癌前改变)中常常仍能产生有用的轮廓,未来可将这些结果重新用于训练。
更快通向新临床工具的路径
由于已有若干模型在其训练时未见过的癌种上表现良好,它们可以作为“起始工具”,而不用迫使专家从零开始标注所有数据。作者概述了实用路径:在某些研究中直接使用一个强模型而不重训;将其输出作为病理学家快速修正的初稿;或通过将补丁级标签与这些分割结果结合,把旧的粗糙数据集转换为精确的像素地图。在有利情况下,这些方法可以将构建新模型所需的时间从一年多缩短到不到一周。对患者而言,这可能意味着准确且可解释的人工智能更快地支持跨多种癌症的诊断和生物标志物发现,且减少重复劳动。
这对未来癌症护理意味着什么
对非专业读者而言,核心信息是:用于描绘肺肿瘤的同一款智能程序往往可以在无需从零开始的情况下重复用于勾画许多其他癌症。这种复用缩短了模型构建中最耗时的环节——专家的细致手工绘制——并帮助研究者将精力集中在测试和改进工具上,而不是反复描绘相同模式。如果进一步开发为真正的“全癌”系统,此类分割模型可成为数字病理学中的标准层,为肿瘤及周围组织提供一致的地图,支持更好的研究、更清晰的报告,并最终促成更有信息量的临床决策。
引用: Bedau, T., Harder, C., Al-Shughri, A. et al. Comprehensive evaluation of cross cancer generalization in histopathology segmentation models across 21 tumor types. Commun Med 6, 302 (2026). https://doi.org/10.1038/s43856-026-01601-x
关键词: 计算病理学, 癌症分割, 深度学习, 数字组织学, 泛癌模型