Clear Sky Science · zh

基于深度学习的甲状腺结节分类：采用具有不确定性感知的多模态超声成像

2026-01-12 · 返回目录

为什么甲状腺结节关系到每个人

甲状腺内出现小结节非常常见，尤其随年龄增长更普遍。大多数结节无害，但少数为恶性，需要及时治疗。当前，医生主要依赖超声检查和细针活检来区分良恶性。超声安全且广泛可得，但其解读因检查者而异，导致一些人接受了不必要的侵入性检查，而另一些患者可能被漏诊。本研究探索将多种超声类型与人工智能系统结合，如何提高甲状腺癌的诊断精度，并向医生报告计算机对其判断的置信程度。

从多种视角观察同一个结节

超声并非只有一种图像类型。常规“B模”超声显示结节的形状和纹理。剪切波弹性成像补充了组织硬度的信息，而组织硬度在良性与恶性病变间常有差异。彩色多普勒则突出结节内外的血流模式。既往研究通常只关注其中一种视图或简单组合，并未清晰处理将各类信息输入计算模型时各自可靠性的差异。

为甲状腺超声构建更智能、更精简的人工智能

研究者前瞻性收集了来自单中心、已安排活检的422名患者的506个甲状腺结节图像。对每个结节，采集了来自同一超声机系列的B模、剪切波弹性成像和彩色多普勒图像。随后他们设计了一个定制的深度学习网络，首先采用紧凑的、预训练的图像识别主干网络，并增加了为医学超声量身定制的轻量级“头部”。该头部使用了能够混合不同特征提取和注意力机制的特殊层，帮助模型聚焦每幅图像中最具信息量的区域，同时保持总体架构较小且高效。

让计算机在不确定时坦诚表达

本研究的一项关键创新是不确定性感知的融合策略。系统不是简单地对三种超声类型的预测求平均，而是估计每个分支在特定患者上的置信度。方法是通过多次在模型内部引入小的变动并运行模型，测量预测的稳定性。如果某一模态（例如彩色多普勒）给出不稳定或矛盾的答案，其对最终决策的影响会被削弱甚至置为零。相反，那些既准确又置信的模态，例如在许多情况下B模与剪切波弹性成像的组合，会被赋予更大权重。这种做法类似放射科医师在直观上更信赖清晰、高质量图像而非嘈杂或模糊图像的判断方式。

系统表现如何？

在严格的交叉验证设计下，三模态组合系统对甲状腺结节的分类准确率约为95%，受试者工作特征曲线下面积（AUC）为0.97。灵敏度——检测癌症的能力——尤其高，达到98%，而排除癌症的特异性为92%。单一影像类型和两种组合的表现较差，表明多模态输入确实增加了价值。不确定性感知的融合方法也优于更简单的预测合并方式，尤其在处理冲突或不可靠输入时表现更好。在与多种改编到相同数据集的知名深度学习模型比较中，该定制架构在层数更少、结构更紧凑的情况下，其性能匹配或超越了这些模型。

对患者与医生意味着什么

对于有甲状腺结节的患者，这项工作指向了这样一种未来：常规超声检查不仅能给出癌症风险的否/是估计，还能提供该估计的可信度。高置信度的良性预测可能帮助避免不必要的活检，而高不确定性的结果则可触发额外影像检查、二次意见或更密切的随访。虽然该研究在单中心进行，仍需在不同医院和超声设备上验证，但结果表明，将多种超声视图与不确定性感知的人工智能系统结合，有望使甲状腺癌诊断更准确、更透明，可能在提高医疗质量的同时减少不必要的操作。

引用: Saini, M., Parvar, T.A., Velarde, M. et al. Deep learning-based classification of thyroid nodules using uncertainty-aware multi-modal ultrasound imaging. Sci Rep 16, 4938 (2026). https://doi.org/10.1038/s41598-026-35965-w

关键词: 甲状腺结节, 超声成像, 深度学习, 癌症诊断, 医学人工智能