Clear Sky Science · zh
CMAF-Net:用于不平衡乳腺癌组织病理学的跨模态注意力融合与信息论正则化
这项研究为何对乳腺癌护理很重要
病理学家通过在显微镜下研究薄切片组织来诊断乳腺癌,但要在大量健康细胞中识别出罕见的癌变区域是一项既繁重又不完美的工作。本研究提出了CMAF-Net,一种旨在帮助在这些图像中捕捉更多癌变同时保持较低误报率的新型计算系统,即便恶性样本在数量上远少于健康样本。它的进展有望使自动化筛查更可靠,支持工作负担沉重的临床医生,并为检测其他多种罕见疾病提供范例。
在组织图像的干草堆中寻找针
在真实的医院数据中,大多数乳腺组织样本是良性的,只有少数含有浸润性导管癌——最常见的乳腺癌类型。这种不平衡导致许多人工智能系统“默认”预测为健康更安全,从而错过危险肿瘤。与此同时,恶性迹象在不同放大倍数下表现各异,从单个细胞的核形态异常到整个组织区域的结构紊乱。传统的图像分析网络通常擅长处理微小细节或大尺度模式,但很少能在同一系统中有效结合两者以突出那些罕见且威胁生命的病例。
将特写细节与宏观图景融合
为了解决这两个问题,作者设计了具有互补性“视角”的CMAF-Net来观察每张图像。一个分支类似经典的模式识别引擎,专注于细微纹理,例如细胞的形状和排列;另一个分支更像全局的版图阅读器,使用现代transformer结构来捕捉更广泛的组织构型。系统并非简单堆叠这两种视角,而是通过一个专门的融合模块让分支之间通过多通道的注意力机制交换信息。该模块有选择地保留能够提供新洞见的特征,同时抑制重复或分散注意力的信号,从而使最终的联合表示既丰富又紧凑。 
教会系统关注罕见的癌症
即便结构巧妙,模型仍可能偏向多数类,因此研究人员重新设计了模型从错误中学习的方式。基于信息论和基于边距学习的思想,他们制定了一种训练规则,明确推动模型在少数类癌症周围形成更宽的“安全边界”。在实际操作中,CMAF-Net 对漏检恶性补丁的惩罚高于错误分类良性补丁的惩罚,并且随着特征空间的成熟这一惩罚会随时间调整。注意力机制本身也通过一种“温度”控制进行调节:更锋利的注意力在需要时保留更多信息,而更柔和的注意力滤除噪声,为模型提供了一种在不丢失区分癌与非癌信号的前提下对数据进行有原则压缩的方法。 
将方法付诸检验
团队在一个大规模、自然不平衡的乳腺组织补丁数据集上评估了CMAF-Net,约四分之三为良性,其余为癌变。与一系列强基线系统相比——包括深度卷积网络、视觉transformer以及先前为不平衡问题定制的融合模型——这一新方法表现突出。它大约正确识别了95%的恶性样本,同时保持了同样较高的特异性,并且参数量少于许多竞争的融合网络。当作者将数据进一步偏斜到每99个良性样本仅有1个癌变补丁时,CMAF-Net 的性能逐步下降但仍保持临床可用。相比之下,其他方法在这种极端条件下大多丧失了识别癌变的能力。
跨显微镜与肿瘤类型的泛化能力
为了检验CMAF-Net是否仅仅在记忆一个数据集还是在学习更普适的疾病模式,作者在一组来自不同患者并以四个不同放大倍数拍摄的乳腺肿瘤图像上进行了测试。在未进行任何再训练的情况下,模型在所有放大级别上仍保持高灵敏度,并且在简单的良性与恶性二类任务以及更具挑战性的覆盖多种肿瘤亚型的八类问题上都优于先前方法。值得注意的是,CMAF-Net 在罕见肿瘤类别上取得了最大的提升,这表明其对信息高效融合和类别感知学习的侧重有助于区分那些微妙且不常见的模式,而不仅仅是最典型的病例。
未来的意义
对非专业读者而言,核心信息是:CMAF-Net 为计算机阅读病理切片提供了一种更智能的方式——它同时兼顾细节与全局、学会对罕见但危险的癌症迹象给予更多关注,并在恶性样本稀少时仍能持续发挥作用。超越乳腺癌,相同的设计原则可以为在多种医学影像中发现罕见疾病提供指导,为医生提供更值得信赖的第二意见,并可能将更早、更准确的诊断带给最需要的患者。
引用: Ativi, W.X., Chen, W., Kwao, L. et al. CMAF-Net: cross-modal attention fusion with information-theoretic regularization for imbalanced breast cancer histopathology. Sci Rep 16, 9607 (2026). https://doi.org/10.1038/s41598-025-32794-1
关键词: 乳腺癌, 组织病理学人工智能, 类别不平衡, 深度学习, 医学图像分析