Clear Sky Science · zh
一种具距离感知学习的多尺度混合ResNet–Transformer用于可解释的BI-RADS乳腺X线分类
这对患者和医生为何重要
乳腺癌筛查能挽救生命,但判断哪些乳房X线真正代表危险即便对专家也很困难。本研究提出了一种新的计算工具,旨在更准确且更透明地将乳腺影像归入大家熟悉的BI-RADS风险等级。通过这样做,它有望减少不必要的活检、更早发现危险的癌症,并为放射科医生提供一个可理解的辅助手段,而不是神秘的黑箱结论。
从乳腺影像到风险分级
乳腺X线通常使用BI-RADS量表报告,范围从“正常”到“高度怀疑癌变”。最关键的等级是BI-RADS 3、4和5,通常需在这些等级上决定短期随访或活检。人工阅片者之间可能出现分歧,尤其是在乳腺致密的女性中,这既会导致癌症漏诊,也会产生不必要的警报。为支持放射科医师,作者在一个公开乳腺摄影数据集上训练了人工智能系统,该数据集中专家已将图像标注为BI-RADS 1到5。他们还必须应对一个常见问题:正常和明确良性图像远多于高风险图像,若不加以纠正会导致学习偏差。

新的智能阅片器如何“看”影像
该系统结合了图像分析中的两种新思路。首先,它使用深度卷积网络(ResNet-50)捕捉细节,如边缘、纹理以及可能提示微钙化的小亮点。其次,加入了Transformer模块——一种在语言模型中流行的结构——以连接图像中相距较远的部分并推理整体模式与对称性。在此之前,乳腺X线图像经过细致预处理:调整尺寸、增强对比以突出细微病灶,并通过过采样平衡罕见类别,使模型在训练期间能见到足够的可疑和恶性病例样本。
教会模型某些错误更严重
标准计算模型通常把所有类别错误视为同等严重,但医学并非如此。把明显正常误判为明显恶性远比把相邻的两个等级(如BI-RADS 2和3)混淆要严重得多。为反映这一点,作者引入了“距离感知”学习策略。损失函数不仅计算对错,还度量预测在有序BI-RADS量表上与真实类别的距离。较大的跳跃会受到更严厉惩罚而非近似错误,从而促使系统在风险等级之间画出更平滑、更符合临床的边界,并避免最危险的误判。

在测试中的表现如何
该系统以两阶段训练和调优,在保留的测试集上表现强劲。总体上它约92%正确分配BI-RADS等级,并在考虑类别不平衡和多类难度的评估指标上取得很高分数。值得注意的是,它在BI-RADS 4和5上的准确率尤其高,这些组别最常导致活检。几乎所有错误都出现在相邻类别之间,这与放射科医生面临的现实灰色区域一致。额外分析表明其预测概率校准良好——即其给出的置信度与实际正确率相匹配——并且优于若干最近为类似任务设计的深度学习方法。
看到模型关注的位置
由于信任在医学中至关重要,作者超越了纯数字评估,检视了驱动系统决策的图像区域。利用Grad-CAM(一种突出影响区域的技术),他们发现模型持续关注病灶、致密组织模式和小亮点簇,而不是无关背景。内部特征空间的可视化显示影像按BI-RADS等级清晰聚类,尤其将可疑与恶性检查与正常和良性检查区分开来。决策曲线分析表明,如果与临床医师共同使用,该工具可能在保持或提高癌症检出率的同时减少不必要的干预,尽管这仍需在实际临床环境中验证。
这些结果对未来意味着什么
这项工作表明,将卷积和Transformer思路结合,并明确教会模型某些错误比其他错误更严重,可以产生既准确又更符合临床思维的AI辅助系统。尽管该研究受限于规模适中、单一来源的数据集并缺乏外部验证,但它指向了不仅在性能上能与放射科医师相匹配,而且能解释其关注点和置信度的AI系统。通过在更大、更具多样性的人群中进一步测试,此类工具有望成为乳腺癌筛查中可靠的合作伙伴,帮助确保适当的女性在适当的时间获得适当的随访。
引用: Singh, M., Mohan, A., Tripathi, U. et al. A multi-scale hybrid ResNet–transformer with distance-aware learning for interpretable BI-RADS mammographic classification. Sci Rep 16, 10033 (2026). https://doi.org/10.1038/s41598-026-40906-8
关键词: 乳腺癌筛查, 乳腺摄影人工智能, BI-RADS分类, 放射学中的深度学习, 可解释的医学影像