Clear Sky Science · zh

使用灰狼优化的视觉变换器与多阶段染色标准化实现放大倍数无关的乳腺癌诊断

2026-03-04 · 返回目录

这项研究对患者和医生的重要性

乳腺癌现已成为全球诊断率最高的癌症，组织样本的显微镜检查仍然是确诊的金标准。然而，病理切片的阅片工作既耗时又存在专家间的主观差异，当图像采集的放大倍数不同或实验室染色略有差异时，阅读难度进一步增加。本研究探索了新一代人工智能工具如何通过训练计算机识别乳腺组织切片中的模式，来帮助病理学家更一致地发现癌变——无论这些图像如何采集。

为混乱的显微图像带来秩序

在真实的医院和实验室中，乳腺组织切片很少完全相同。染料、照明和扫描仪设置的差异会使颜色从深紫到浅粉发生偏移，即便底层组织相似。作者先解决这个问题，再训练任何 AI 模型。他们设计了一个四步清理管线，依次调整对比度、统一整体亮度、校正光照不均，并最终标准化常用的苏木精-伊红（H&E）染色的外观。在名为 BreakHis 的公开数据集上处理了 7,900 多张图像，这一流程使细胞结构更清晰、颜色在样本间及四个标准显微放大倍数下更一致。

在良性与恶性样本之间取得平衡

第二个现实问题是类别不平衡：数据集中癌变图像数量远多于良性图像。如果放任不管，AI 模型可能“学会”把所有样本都判为癌，从而在指标上看起来不错，却在临床中对患者造成伤害。为避免这种情况，研究者通过精心选择的变换对欠代表的良性类进行人工扩增，模拟真实世界的变异。他们对图像进行翻转、旋转、轻微调整亮度和颜色，并加入适度模糊——同时不破坏对诊断至关重要的细微细胞结构。完成这一处理后，各放大倍数下的良性与恶性样本在数量上达成均衡，给予模型公平学习两类的机会。

教会变换器“阅读”组织切片

团队没有使用传统的卷积神经网络，而是采用了视觉变换器（Vision Transformer）——这种设计最初用于语言处理，后来被改用于图像。变换器不是用小滤波器扫描图像，而是将每张切片切分为许多小补丁，并学习这些片段在整张图像中的相互关系。这种全局视角对组织病理学非常有价值，因为细胞形态与组织排列方式能指示肿瘤是良性还是侵袭性。模型针对每个放大倍数（40×、100×、200×、400×）分别训练，使用准确率、精确度、召回率、混淆矩阵和交叉验证等标准指标检验性能，以确保结果稳定而非单次划分的偶然。

让受自然启发的优化器微调 AI

视觉变换器有许多“旋钮”会显著影响性能：网络深度、注意力头数、内部表示维度、dropout 比例和学习率等。研究者没有通过反复试错来调整这些参数，而是采用了一种元启发式算法——灰狼优化器（Grey Wolf Optimizer）。该算法受狼群围猎和协同行动的启发，探索参数组合并逐步集中到能最小化验证误差的设置上。在每个放大倍数下独立应用时，它发现了能更好利用已清理并平衡图像的变换器配置。

各放大倍数上清晰的准确率提升

经过优化后，所提出的综合框架——染色感知的预处理、基于放大倍数的样本平衡以及灰狼优化调优的视觉变换器——取得了强劲且稳定的结果。测试准确率在最低放大倍数约为 92%，在最高放大倍数上升至 94%。重要的是，癌变（恶性）病例的召回率略高于良性病例，这一点至关重要，因为漏诊癌症比把良性样本标记为可进一步检查要严重得多。通过五折交叉验证重复实验显示波动很小，表明系统学到的是稳健的线索而不是记住训练集。

对未来癌症护理的潜在意义

简而言之，研究表明：当对组织图像进行细致标准化并对基于变换器的模型进行智能调优时，AI 系统可以在多个显微放大倍数下可靠地区分乳腺良性与恶性样本。尽管该工作目前仅限于一个公开数据集与二元分类（癌 VS 非癌），但它指向了可能帮助过度负荷的病理学家进行切片预筛查、标出可疑区域并减少漏诊的临床工具。通过更广泛的多中心验证与进一步改进，这类放大倍数无关的 AI 助手有望成为数字病理工作流程中加速且统一乳腺癌诊断的组成部分。

引用: Fatma, T., Sahu, P.K., Choudhury, S. et al. Magnification-independent breast cancer diagnosis using a GWO-enhanced vision transformer with multi-stage stain normalization. Sci Rep 16, 11930 (2026). https://doi.org/10.1038/s41598-026-42490-3

关键词: 乳腺癌组织病理学, 视觉变换器, 染色标准化, 医学影像分类, 深度学习优化