Clear Sky Science · zh
基于集成的高性能深度学习模型用于乳腺癌检测中的医学影像检索
更智能的扫描为何对乳腺健康至关重要
乳腺癌是女性中最常见的癌症之一,超声检查是早期发现可疑肿块的重要工具。但当前医生需要在日益增长的医学影像档案中检索信息,能够提供帮助的计算机系统往往难以真正“理解”所见。本研究提出一种更智能的乳腺超声图像检索引擎,其不仅能高精度地定位和分类肿瘤,还能向医生显示哪些图像区域影响了系统的决策。

从静态图像到有用的比对
医院现在保存大量乳腺超声影像,使得寻找与新患者影像相似的既往病例既困难又耗时。早期基于内容的图像检索系统使用亮度或纹理等基本特征进行比较,这常常无法匹配放射科医生对疾病的判断方式。作者旨在缩小这一差距:他们在一个广泛使用的包含830张乳腺超声图像的集合上训练深度学习系统,这些图像被分为正常组织、良性肿瘤和恶性肿瘤三类。目标有两方面:将新影像分类到这三类之一,然后自动检索相似的既往影像以辅助诊断。
教会混合型人工智能识别模式
团队构建了一个“混合”模型,结合了三种神经网络,各有不同功能。卷积网络擅长读取超声图像中的空间模式,例如肿块的形状或边缘的清晰程度。循环网络通常用于处理语音等序列数据,这里被改造为将像素行视为一种有序信号,帮助系统注意图像中细微的变化。在此基础上,可解释性AI组件生成热图,高亮出对决策影响最大的图像区域,使临床医生可以检验模型是否关注了肿瘤本身而非无关背景。
清洗、扩充与组织数据
在训练前,研究人员对超声图像进行了细致预处理。他们去除重复和无用的边框,将影像转换为统一的灰度格式,裁切空白区域,并将所有图像调整为标准的小正方形,以便模型高效处理数据。每张图像都被标注为正常、良性或恶性,并提供肿瘤区域的掩码图像。由于医学数据集通常较小,他们通过旋转、翻转、缩放和调整对比度等方式对样本进行人工扩充,将训练集从548张扩增到3,840张。这些受控的变换让网络学会应对不同设备和不同患者中肿瘤出现的多种表现形式。

系统如何分类与检索
训练完成后,混合模型将每张超声图像转换为一个来自倒数第二层的紧凑数值指纹。具有相似指纹的图像往往展示相似的组织模式,因此团队可以通过计算这些指纹之间的简单距离来寻找数据库中最接近的匹配。系统首先预测新影像是正常、良性还是恶性,然后检索在视觉和临床上相似的病例,为放射科医生提供参考图像画廊。可解释性模块在原始影像上叠加暖色区域,显示网络“注视”以作出结论的位置,这有助于建立信任并支持教学与第二意见。
这些结果对患者意味着什么
在乳腺超声数据集上的测试中,该混合方法达到约99%的分类准确率,且优于若干依赖单一架构的主流深度学习模型。它在多次训练-测试划分下也表现出稳定性,表明其性能并非某一次数据划分的偶然结果。对患者而言,这意味着未来放射科医生不仅可以获得高度可靠的计算机辅助超声读片,还能即时看到相似的既往病例以及图像中确切令人担忧的部位。作者也指出,仍需更大范围的临床试验和对其它影像类型的测试,但这项工作指向在乳腺癌检测中更透明、可靠和高效地使用人工智能的可能性。
引用: Fawzy, A.E., Almandouh, M.E., Herajy, M. et al. Ensemble-based high-performance deep learning models for medical image retrieval in breast cancer detection. Sci Rep 16, 8723 (2026). https://doi.org/10.1038/s41598-026-38218-y
关键词: 乳腺超声, 医学影像检索, 深度学习, 乳腺癌检测, 可解释的人工智能