Clear Sky Science · zh

一种具距离感知学习的多尺度混合ResNet–Transformer用于可解释的BI-RADS乳腺X线分类

2026-02-20 · 返回目录

这对患者和医生为何重要

乳腺癌筛查能挽救生命，但判断哪些乳房X线真正代表危险即便对专家也很困难。本研究提出了一种新的计算工具，旨在更准确且更透明地将乳腺影像归入大家熟悉的BI-RADS风险等级。通过这样做，它有望减少不必要的活检、更早发现危险的癌症，并为放射科医生提供一个可理解的辅助手段，而不是神秘的黑箱结论。

从乳腺影像到风险分级

乳腺X线通常使用BI-RADS量表报告，范围从“正常”到“高度怀疑癌变”。最关键的等级是BI-RADS 3、4和5，通常需在这些等级上决定短期随访或活检。人工阅片者之间可能出现分歧，尤其是在乳腺致密的女性中，这既会导致癌症漏诊，也会产生不必要的警报。为支持放射科医师，作者在一个公开乳腺摄影数据集上训练了人工智能系统，该数据集中专家已将图像标注为BI-RADS 1到5。他们还必须应对一个常见问题：正常和明确良性图像远多于高风险图像，若不加以纠正会导致学习偏差。

新的智能阅片器如何“看”影像

该系统结合了图像分析中的两种新思路。首先，它使用深度卷积网络（ResNet-50）捕捉细节，如边缘、纹理以及可能提示微钙化的小亮点。其次，加入了Transformer模块——一种在语言模型中流行的结构——以连接图像中相距较远的部分并推理整体模式与对称性。在此之前，乳腺X线图像经过细致预处理：调整尺寸、增强对比以突出细微病灶，并通过过采样平衡罕见类别，使模型在训练期间能见到足够的可疑和恶性病例样本。

教会模型某些错误更严重

标准计算模型通常把所有类别错误视为同等严重，但医学并非如此。把明显正常误判为明显恶性远比把相邻的两个等级（如BI-RADS 2和3）混淆要严重得多。为反映这一点，作者引入了“距离感知”学习策略。损失函数不仅计算对错，还度量预测在有序BI-RADS量表上与真实类别的距离。较大的跳跃会受到更严厉惩罚而非近似错误，从而促使系统在风险等级之间画出更平滑、更符合临床的边界，并避免最危险的误判。

在测试中的表现如何

该系统以两阶段训练和调优，在保留的测试集上表现强劲。总体上它约92%正确分配BI-RADS等级，并在考虑类别不平衡和多类难度的评估指标上取得很高分数。值得注意的是，它在BI-RADS 4和5上的准确率尤其高，这些组别最常导致活检。几乎所有错误都出现在相邻类别之间，这与放射科医生面临的现实灰色区域一致。额外分析表明其预测概率校准良好——即其给出的置信度与实际正确率相匹配——并且优于若干最近为类似任务设计的深度学习方法。

看到模型关注的位置

由于信任在医学中至关重要，作者超越了纯数字评估，检视了驱动系统决策的图像区域。利用Grad-CAM（一种突出影响区域的技术），他们发现模型持续关注病灶、致密组织模式和小亮点簇，而不是无关背景。内部特征空间的可视化显示影像按BI-RADS等级清晰聚类，尤其将可疑与恶性检查与正常和良性检查区分开来。决策曲线分析表明，如果与临床医师共同使用，该工具可能在保持或提高癌症检出率的同时减少不必要的干预，尽管这仍需在实际临床环境中验证。

这些结果对未来意味着什么

这项工作表明，将卷积和Transformer思路结合，并明确教会模型某些错误比其他错误更严重，可以产生既准确又更符合临床思维的AI辅助系统。尽管该研究受限于规模适中、单一来源的数据集并缺乏外部验证，但它指向了不仅在性能上能与放射科医师相匹配，而且能解释其关注点和置信度的AI系统。通过在更大、更具多样性的人群中进一步测试，此类工具有望成为乳腺癌筛查中可靠的合作伙伴，帮助确保适当的女性在适当的时间获得适当的随访。

引用: Singh, M., Mohan, A., Tripathi, U. et al. A multi-scale hybrid ResNet–transformer with distance-aware learning for interpretable BI-RADS mammographic classification. Sci Rep 16, 10033 (2026). https://doi.org/10.1038/s41598-026-40906-8

关键词: 乳腺癌筛查, 乳腺摄影人工智能, BI-RADS分类, 放射学中的深度学习, 可解释的医学影像