Clear Sky Science · zh

基于深度学习的甲状腺结节分类:采用具有不确定性感知的多模态超声成像

· 返回目录

为什么甲状腺结节关系到每个人

甲状腺内出现小结节非常常见,尤其随年龄增长更普遍。大多数结节无害,但少数为恶性,需要及时治疗。当前,医生主要依赖超声检查和细针活检来区分良恶性。超声安全且广泛可得,但其解读因检查者而异,导致一些人接受了不必要的侵入性检查,而另一些患者可能被漏诊。本研究探索将多种超声类型与人工智能系统结合,如何提高甲状腺癌的诊断精度,并向医生报告计算机对其判断的置信程度。

Figure 1
Figure 1.

从多种视角观察同一个结节

超声并非只有一种图像类型。常规“B模”超声显示结节的形状和纹理。剪切波弹性成像补充了组织硬度的信息,而组织硬度在良性与恶性病变间常有差异。彩色多普勒则突出结节内外的血流模式。既往研究通常只关注其中一种视图或简单组合,并未清晰处理将各类信息输入计算模型时各自可靠性的差异。

为甲状腺超声构建更智能、更精简的人工智能

研究者前瞻性收集了来自单中心、已安排活检的422名患者的506个甲状腺结节图像。对每个结节,采集了来自同一超声机系列的B模、剪切波弹性成像和彩色多普勒图像。随后他们设计了一个定制的深度学习网络,首先采用紧凑的、预训练的图像识别主干网络,并增加了为医学超声量身定制的轻量级“头部”。该头部使用了能够混合不同特征提取和注意力机制的特殊层,帮助模型聚焦每幅图像中最具信息量的区域,同时保持总体架构较小且高效。

让计算机在不确定时坦诚表达

本研究的一项关键创新是不确定性感知的融合策略。系统不是简单地对三种超声类型的预测求平均,而是估计每个分支在特定患者上的置信度。方法是通过多次在模型内部引入小的变动并运行模型,测量预测的稳定性。如果某一模态(例如彩色多普勒)给出不稳定或矛盾的答案,其对最终决策的影响会被削弱甚至置为零。相反,那些既准确又置信的模态,例如在许多情况下B模与剪切波弹性成像的组合,会被赋予更大权重。这种做法类似放射科医师在直观上更信赖清晰、高质量图像而非嘈杂或模糊图像的判断方式。

Figure 2
Figure 2.

系统表现如何?

在严格的交叉验证设计下,三模态组合系统对甲状腺结节的分类准确率约为95%,受试者工作特征曲线下面积(AUC)为0.97。灵敏度——检测癌症的能力——尤其高,达到98%,而排除癌症的特异性为92%。单一影像类型和两种组合的表现较差,表明多模态输入确实增加了价值。不确定性感知的融合方法也优于更简单的预测合并方式,尤其在处理冲突或不可靠输入时表现更好。在与多种改编到相同数据集的知名深度学习模型比较中,该定制架构在层数更少、结构更紧凑的情况下,其性能匹配或超越了这些模型。

对患者与医生意味着什么

对于有甲状腺结节的患者,这项工作指向了这样一种未来:常规超声检查不仅能给出癌症风险的否/是估计,还能提供该估计的可信度。高置信度的良性预测可能帮助避免不必要的活检,而高不确定性的结果则可触发额外影像检查、二次意见或更密切的随访。虽然该研究在单中心进行,仍需在不同医院和超声设备上验证,但结果表明,将多种超声视图与不确定性感知的人工智能系统结合,有望使甲状腺癌诊断更准确、更透明,可能在提高医疗质量的同时减少不必要的操作。

引用: Saini, M., Parvar, T.A., Velarde, M. et al. Deep learning-based classification of thyroid nodules using uncertainty-aware multi-modal ultrasound imaging. Sci Rep 16, 4938 (2026). https://doi.org/10.1038/s41598-026-35965-w

关键词: 甲状腺结节, 超声成像, 深度学习, 癌症诊断, 医学人工智能