Clear Sky Science · zh

基于可解释人工智能（XAI）的MobileNetV1 与视觉变换器相结合的不同 BI-RADS 乳腺癌诊断

2026-02-17 · 返回目录

更早看到癌症风险

乳腺癌在早期发现时最易治疗，但读片是一项既困难又时间紧迫的工作。本研究描述了一种新的人工智能（AI）系统，旨在不仅以极高的准确率识别乳腺摄影中的癌症征象，还能向医生明确展示图像中哪些区域影响了其决策。通过巧妙地结合两种现代图像分析技术，该系统旨在为放射科医师提供快速、可靠且透明的第二意见支持。

为什么读乳腺摄影很难

乳腺摄影是用于检查早期癌症迹象的乳腺 X 光图像。放射科医师会为每次检查分配一个 BI-RADS 评分，这是一个标准化的量表，范围从正常发现到明确的癌变。在致密乳房中，由于腺体组织繁多，可疑斑点可能被遮盖或看起来与无害结构相似。此前许多计算机辅助工具要么只关注简单的有无癌症判断、要么难以应对完整的 BI-RADS 分类范围，或以黑箱方式工作，使医生无法确定某一决策的理由。

将两种“观察”图像的方式融合

研究人员构建了一个混合 AI 框架，模拟细致的人类读片者可能的扫描方式：先检查小的细节，然后考虑整体图景。系统的一部分基于紧凑网络 MobileNetV1，专注于局部细节，例如微小钙化点和清晰的病灶边界。另一部分是视觉变换器（vision transformer），将图像分成若干补丁并分析整个乳房中模式的相互关系，捕捉整体组织结构和细微的变形。随后，这两条“流”提取的特征被合并为对每张图像的单一而丰富的描述。

清洗、平衡与简化数据

在图像进入 AI 流程之前，它们需要经过若干预处理步骤。团队使用一种在不放大噪声的情况下增强微弱结构的方法来改善对比度，使隐约的病灶更易被识别。图像被调整大小并归一化，以便系统以一致的方式查看它们。为应对某些 BI-RADS 类别（例如明确恶性的病例）相对罕见这一事实，作者使用诸如小幅旋转和翻转的数据增强技巧，并采用类意识训练，使得不常见类别在学习过程中仍具有影响力。在两条流提取特征后，使用主成分分析这种数学工具对信息进行压缩，保留最重要的部分同时降低复杂度。

从特征到风险评分，并附带解释

在最后一步，作者没有依赖沉重且不透明的神经网络分类器，而是使用许多简单的逻辑回归模型并以“装袋”（bagging）集成。每个模型都以直接的方式将图像特征与 BI-RADS 风险等级联系起来，它们的多数投票提供了稳定性并减少了在相对有限数据集上过拟合的风险。在对来自 King Abdulaziz University Breast Cancer 数据集的 6000 多张乳腺摄影进行测试时，该混合系统在其针对的四个关键 BI-RADS 类别（正常、可能良性、可疑和恶性）上实现了超过 99% 的准确率、敏感性和特异性。

让医生看到 AI 所见

为了使其决策可理解，系统采用了可解释 AI 技术，如 Grad-CAM 和 Grad-CAM++。这些方法产生覆盖在乳腺摄影上的彩色热图，突出显示对预测 BI-RADS 评分影响最大的区域。在恶性病例中，突出区域通常与专家放射科医师所注意到的肿块或钙化簇一致；在正常图像中，通常几乎没有或没有集中激活。此类可视化反馈有助于临床医生判断模型是否关注医学上有意义的特征，并能揭示为何某些边缘病例（例如模拟病灶的致密组织）即使对专家也很难判断。

这对患者意味着什么

研究表明，在单一临床数据集上，这种双流、可解释的 AI 系统能够将乳腺摄影分类为多个风险等级，其准确性可与许多先前方法相媲美，甚至在某些方面超出它们。尽管仍需在更具多样性的人群和不同医院中进行测试，该方法指向一种不仅高度准确，而且对繁忙门诊足够快速且透明到能赢得放射科医师与患者信任的 AI 工具。在实际应用中，这类系统可作为额外的一双专家之眼——标记细微发现、减少漏诊并支持关于乳腺癌风险的更清晰、更有信心的沟通。

引用: Abdelsabour, I., Elgarayhi, A., Sallah, M. et al. Different BI-RADS breast cancer diagnosis using MobileNetV1 and vision transformer based on explainable artificial intelligence (XAI). Sci Rep 16, 7190 (2026). https://doi.org/10.1038/s41598-026-37199-2

关键词: 乳腺癌, 乳腺摄影, 人工智能, 视觉变换器, 可解释 AI