Clear Sky Science · zh

通过自监督学习与基于注意力的伪标签实现弱监督结直肠腺体分割

· 返回目录

这为何对癌症诊断重要

当病理学家在显微镜下观察结肠活检标本时,腺体——这些微小的管状结构——的形状与组织方式是判定癌症严重程度的重要线索。人工逐一描绘每个腺体既耗时又昂贵,而且难以在不同医院之间标准化。该研究展示了人工智能如何在使用远少于精细人工标注的情况下,几乎以专家同等的水平描绘这些腺体,可能加速并提高结直肠癌的诊断质量。

Figure 1
Figure 1.

逐个描绘每条细小轮廓的挑战

结直肠癌是全球最常见且致死率较高的癌症之一,其分级在很大程度上依赖于腺体的外观。在健康或早期组织中,腺体呈整齐、圆管状;而在侵袭性肿瘤中,它们可能变得参差不齐、融合或几乎无法辨认。计算机可以被训练去分割或“填色”每个腺体,以便自动测量,但传统深度学习系统需要病理学专家逐像素地绘制轮廓。在实际临床中,更容易获得的是简单的图像级标签,例如某个组织图块是否包含腺体,或是否为良性或恶性。

从未标注与弱标注切片中教会AI

作者提出了一个三步训练流程,旨在从这些较弱的标签中榨取更多信息。首先,他们以一个名为 DINOv2 的强大视觉模型为起点(该模型最初在自然照片上进行训练),并让它接触数千张未标注的结直肠活检图像。通过要求模型将同一组织补丁的不同视图相互匹配,它学会了适应病理切片颜色与纹理的视觉特征,而无需任何注释。这一步生成了一个专门的“编码器”,将原始图像转换为捕捉类腺体结构的丰富内部表征。

让AI显示它关注的区域

在第二阶段,这个编码器被接入一个只需要图像级标签的分类网络,比如是否存在腺体。网络内部的注意力机制学会为其决策分配更高权重给最重要的图像区域。这些注意力图有效地突出显示了网络“认为”腺体所在的位置。研究者将这些软热图通过融合与阈值处理转成粗糙的二值掩码,并使用一种称为条件随机场的概率平滑技术进一步清理。结果是一组经精炼的伪标签:计算机生成的腺体轮廓,虽不完美,但足以引导更专门的分割模型。

Figure 2
Figure 2.

锐化腺体边界

在第三阶段,使用这些伪标签作为人工注释的替代来训练一个专门的分割网络。它重用微调后的编码器,并增加一个轻量的解码头,将特征转换回详细的腺体掩码。关键在于训练时的损失函数对边界给予更多关注:扭曲腺体边缘的错误比内部的小误差受到更重的惩罚。这种边界感知的训练鼓励产生清晰、解剖学上更真实的轮廓,这对于准确测量腺体形状与分离至关重要。

在实践中表现如何?

团队在两个标准的结直肠组织基准数据集上测试了他们的方法。在 GlaS 数据集上,他们的弱监督方法不仅优于其他同样使用有限标签的方法,而且在若干指标上接近或超过了依赖完整像素级注释的传统全监督系统。在一个更具挑战性的 CRAG 数据集(包含高度不规则且恶性的腺体)上,各方法的性能都有所下降,但该框架仍优于其他弱标签竞争者,并缩小了与全监督模型的差距。消融研究表明,每个组分——自监督微调、基于注意力的伪标签与后处理、以及边界感知损失——都对性能提升有显著贡献。

这对未来病理工具意味着什么

对普通读者来说,核心结论是这项工作指向了这样的AI系统:在主要依赖医院档案中已经常见的简单切片级标签的情况下,仍能提供高质量、边界精确的显微腺体结构图。通过减少对繁琐人工描绘的依赖,该方法可能使先进的基于图像的分级与量化分析在更多中心变得可行,帮助病理学家更一致、更高效地诊断结直肠癌,并有望在未来扩展到其他组织类型与结构。

引用: Wen, H., Wu, Y., Huang, D. et al. Weakly supervised colorectal gland segmentation through self-supervised learning and attention-based pseudo-labeling. Sci Rep 16, 5771 (2026). https://doi.org/10.1038/s41598-026-36256-0

关键词: 结直肠癌, 数字病理学, 腺体分割, 弱监督学习, 自监督视觉