Clear Sky Science · zh

混合注意力机制的多任务学习用于胎儿腹部标准平面识别与关键解剖结构检测

2026-04-14 · 返回目录

帮助医生在出生前“看见”

产前超声是父母和医生了解胎儿健康的首批窗口之一。但解读那些颗粒感强的黑白图像是一项需要多年训练的技能，细微的差别可能决定能否早期发现问题。本研究提出了一个旨在辅助的计算机系统：一种人工智能工具，可以快速识别胎儿腹部的标准视图，并突出常规产检中医生关注的关键器官。

为什么标准视图很重要

在孕中期做超声检查时，临床医生并不是“随便看一看”。他们会有意识地寻找一组胎儿的标准视图。对于腹部，这些包括用于测量腹围的横断面、聚焦膀胱、脐带以及多个肾脏与脊柱角度的视图。整体上，这些平面帮助医生估算生长情况、检查结构性问题并评估围产期风险。获取每个标准视图需要精确的手部操作和扎实的解剖学知识，而外观相似的切面很容易混淆——尤其对于经验较少的人员或图像噪声较大时。

将超声图像转化为数据

为训练计算机来辅助这项任务，研究者首先汇集了大量真实临床图像。四年间，他们从多家医院、使用多种设备收集了超过6700张腹部超声图像，来自3100多名孕妇。经验丰富的超声医生在每张图像上仔细勾画了14个关键解剖结构——例如胃、膀胱、肾脏、主要血管、脊柱、肋骨和脐带——并标注每张图像对应的七种标准腹部视图中的哪一种。这一费时的标注过程建立了将像素模式与临床有意义结构连接起来的丰富“地图”。

一种兼具双重功能并具有聚焦注意力的AI

基于该数据集，团队开发了一个名为 FAUSP-NET 的深度学习模型。与只执行单一任务的系统不同，FAUSP-NET 是一个多任务网络：它在一次前向传递中既为关键器官画出边框，又判断图像属于哪种标准视图。底层采用了现代目标检测骨干网络，并增强了若干“注意力”模块，帮助模型聚焦在最有信息量的区域和尺度上。有些注意力模块强调外观相近结构之间的细微差别（例如左、右肾或脐带与邻近血管），另一些则自适应应对大小差异很大的器官。一个专门设计的损失函数帮助系统从罕见或难以识别的结构中学习，从而提升其描绘的精确度。

系统表现如何

训练完成后，FAUSP-NET 在留出测试集上进行了评估，并与24种现有的计算机视觉模型比较，包括流行的目标检测器和图像分类器。在器官检测和标准视图识别两项任务上，它都比这些模型更为准确。就器官检测而言，它在绝大多数情况下与医生的标注相匹配，大多数结构的检测几乎达到完美可靠；仅最微弱、最小的特征（如某些血管和膈肌）仍然具有挑战性。视图识别方面，该系统将图像分类为七种腹部平面之一的准确率超过97%。在标准硬件上，它处理每张图像约需24毫秒——足以在检查过程中实现实时使用。

将AI与人类专家比较

为评估该工具与真实临床医生的对比，研究者在另一家医院的完全独立图像集上进行了测试，并将其性能与初级、中级和高级超声医生比较。FAUSP-NET 在结构检测和标准视图识别方面的准确度接近或匹配有经验的高级医师，并明显优于经验较少的医生。至关重要的是，该系统完成分析所需时间不到高级医生审阅相同病例时间的百分之一。可视化技术显示模型倾向于关注与人工专家依赖的相同区域，这支持其可解释性以及在临床实践中被接受的潜力。

这对准父母意味着什么

通俗地说，这项工作表明经过精心训练的人工智能系统可以在产前腹部超声检查中充当第二双眼睛。FAUSP-NET 能快速标示是否捕获了正确的腹部视图以及关键器官是否清晰可见，帮助经验不足的超声员避免错误，并让专家将注意力集中在复杂病例上。尽管仍需在更多医院和设备上进行进一步测试，该技术指向了一个未来：常规产检超声将更一致、更快速、不那么依赖操作者的经验，从而可能改善母婴护理质量。

引用: Li, Y., Huang, Y., Liu, Z. et al. Mixed attention mechanism multi-task learning for fetal abdominal standard plane recognition and key anatomical structure detection. Sci Rep 16, 12324 (2026). https://doi.org/10.1038/s41598-026-40590-8

关键词: 产前超声, 胎儿腹部, 深度学习, 标准平面检测, 医学图像分析