Clear Sky Science · zh

使用细胞学或组织病理学全切片图像的恶性肿瘤与肿瘤来源预测的深度学习

· 返回目录

为什么肺部和腹部周围的液体很重要

当液体在肺周围(胸腔积液)或腹腔内(腹水)积聚时,常常是癌症已发生转移的早期信号。医生会在显微镜下检查这些液体寻找癌细胞,但这项工作既繁琐又耗时,甚至专家之间有时也会意见不一。本研究描述了一种新的人工智能(AI)系统,能够扫描这些液体的整张数字切片,帮助判断是否存在癌症,甚至提示肿瘤最可能的起始部位。

将显微镜切片变成数字地图

现代病理实验室可以将玻片扫描成超高分辨率的数字图像,每张图像包含数百万个细胞。研究者使用了两类制备方式的全切片图像:稀薄的“涂片”和类似微小组织样本的“细胞栓块”。他们重点研究了来自一家大型医院的胸腹腔液体标本,并结合了来自大型国际癌症数据库的额外组织样本。由于在这种规模下人工标注每个癌细胞不可行,团队构建了一种能够从切片级别标签(如“恶性”或“良性”)中学习而无需详细注释的方法。

Figure 1
Figure 1.

一种自我学习要点的AI

该系统名为 MAMILE‑UNI,结合了两个关键思路。首先,它将每张切片分割成许多小的图像补丁,并将这些补丁输入一个已通过自监督方式在数百万张病理图像上预训练的强大学习网络(transformer)。这种自我训练步骤让模型自行发现有用的视觉模式——比如细胞簇和组织纹理。其次,一个注意力模块学习哪些补丁对诊断最重要,有效模拟病理学家扫描可疑区域的方式。对决策影响较大的补丁会被突出显示,生成热图,展示算法在标注某张切片为恶性或非恶性时“关注”了哪里。

在胸腹腔液体中检测癌症

研究团队在1250张来自胸腔积液和腹水的液体切片上评估了 MAMILE‑UNI。与五种领先的深度学习方法相比,这一新系统始终更为准确。在胸腔积液样本中,无论是涂片还是细胞栓块,它均能大约在9次中正确区分9次恶性与良性。对腹水样本,其准确率相近,并在同时保持高敏感性(抓住真实癌症)和高特异性(避免误报)方面表现尤为稳健。统计检验显示其预测与真实诊断高度一致,并显著优于竞争模型。重要的是,即便在切片上癌细胞稀少——这是常常挑战人类读片者的情形——该系统仍然保持可靠。

Figure 2
Figure 2.

追溯癌症的起源

除了简单地标记恶性,作者还探讨AI能否推断转移性肿瘤的起始部位——当原发灶不明时这是一个重大挑战。使用来自胸腔积液和腹水的细胞学涂片,模型学会将切片分配到肺、乳腺、胃肠道或妇科器官等广泛的来源组。它在肺癌和乳腺癌上的准确性尤其高,而对较罕见或形态多样的肿瘤表现则更为有限。为测试泛化能力,研究者还将 MAMILE‑UNI 应用于来自全球69家医院的1196张组织学切片。在这些组织学图像上,该系统对肿瘤来源的识别准确率极高,接近与真实诊断的一致性。

速度、效率与对临床医生的支持

病理学家通常至少需要十分钟来仔细审阅一张数字细胞学切片。相比之下,MAMILE‑UNI 在将数GB大小的图像压缩为紧凑特征集后,能在一块常见显卡上用不到两分钟处理整张切片并返回预测。基于曲线的评估显示,模型倾向于将真实的恶性病例排在优先列表前列,在不同决策阈值下呈现有利的收益与风险平衡,并生成与真实临床结局良好对齐的概率评分。注意力图与专家病理学家标记的区域高度重合,表明AI的关注点具有临床意义,而非任意分布。

这对患者和医生意味着什么

对于胸腔或腹腔有积液的患者,及时且准确的诊断对治疗决策至关重要,但现有检测往往速度慢、主观性强且费用高昂。本研究表明,经过精心设计的AI系统可以可靠地筛查数字化的液体与组织切片以寻找癌症迹象,并提供肿瘤起源的线索,同时仅需适度的计算资源。作者强调,MAMILE‑UNI 不是用来取代病理学家,而是作为一种辅助工具,可能减轻工作负担、提高一致性并扩大优质癌症诊断的可及性——尤其是在缺乏专科经验和高级实验室检测的环境中。

引用: Wang, CW., Chu, TC., Wu, TK. et al. Deep learning for malignancy and tumor origin prediction using cytology or histopathology whole slide images. npj Digit. Med. 9, 175 (2026). https://doi.org/10.1038/s41746-026-02359-1

关键词: 细胞学 AI, 胸腔积液, 腹水, 肿瘤来源预测, 数字病理学