Clear Sky Science · zh

ResTransUNet:用于CT扫描自动肝脏分割的双编码器混合网络

· 返回目录

这对患者护理的重要性

医生在规划癌症治疗或手术时依赖 CT 扫描来清晰观察肝脏,但目前许多医院仍要求专家在数百张图像上手工描绘器官轮廓。这个过程既慢又累,并且在不同人员之间会有差异。这里描述的研究提出了一种可以自动且高精度勾勒肝脏的计算程序,能够帮助放射科医生更快工作并提高肝脏护理的一致性。

将原始扫描转为清晰的器官轮廓

该研究处理了一个非常实用的问题:如何教会计算机在嘈杂、低对比度且器官边界常常模糊或中断的 CT 图像中找到肝脏。像阈值分割或区域生长等传统图像方法在肝脏与邻近组织外观相似时表现不佳。早期的机器学习系统依赖手工设计的规则和特征,限制了它们对新患者的适应能力。更近的深度学习模型,特别是基于 U 形结构的网络,通过从数据中直接学习特征提高了性能,但它们仍然缺乏对图像更广泛上下文的捕捉,而这在边界不清时至关重要。

Figure 1. 计算模型将 CT 体扫自动转化为精确的肝脏轮廓。
Figure 1. 计算模型将 CT 体扫自动转化为精确的肝脏轮廓。

用于观察细节与上下文的“双通道大脑”

为了解决这些问题,作者提出了一种名为 ResTransUNet 的模型,它混合了两种不同的图像处理方式。一条通路是经典的卷积路径,受广泛使用的 U-Net 设计启发,非常擅长捕捉局部细节和精确形状。另一条通路由 Transformer 模块构成,这类较新的模型善于捕捉图像中远程的关系,例如肝脏不同远端区域之间的联系。关键思想是让这两条通路并行运行并在网络中持续互相交流,以便在每个处理阶段将清晰的局部边缘与广泛的上下文理解融合。

模型如何学习关注重点

在卷积通路中,网络使用残差连接和通道注意力模块以保持有用信息的流动并强调最具信息性的模式。一个名为特征增强单元的特殊组件作为 Transformer 与卷积通路之间的桥梁。在网络的多个深度位置,它将来自 Transformer 的全局视野与卷积的局部特征结合起来,然后学习每个通道应贡献多少强度。此外,多尺度模块同时以多个虚拟放大级别观察图像,帮助模型应对大小形态各异的肝脏以及被分割成小块的区域。

在多种扫描类型上的测试

研究人员主要在一个用于国际竞赛的大型公共肝脏 CT 集合上训练和测试 ResTransUNet,然后检验其在另外三个知名数据集上的迁移表现。他们衡量了计算机绘制的肝脏与专家轮廓的重叠程度、错误包含组织的频率以及体积误差的多少。在所有这些测试中,新模型始终优于八种强竞争方法,包括经典的 U-Net 变体和已使用 Transformer 的其他系统。它在处理小型或碎片化肝区以及肝脏边界难以辨认的扫描时表现出特别的鲁棒性。

Figure 2. 两条联动通路结合细节与广域上下文以在 CT 图像中标记肝脏。
Figure 2. 两条联动通路结合细节与广域上下文以在 CT 图像中标记肝脏。

从实验室走向阅片室

对非专业读者来说,结论是这项工作提供了一种自动工具,能够在 CT 图像上以接近专家水平的精度勾勒肝脏,同时在不同数据集和器官间表现可靠。通过将注重细节的通路与具有上下文感知的通路相结合,ResTransUNet 减少了漏检区域和误报。尽管作者指出,实际部署仍需与医院系统谨慎集成并在更广泛的扫描仪和患者群体上进行测试,但该方法展示了将现代深度学习思想智能组合,如何把复杂的医学影像转化为用于诊断和治疗规划的清晰可信图谱。

引用: Wang, Y. ResTransUNet: a dual-encoder hybrid network for automated liver segmentation in CT scans. Sci Rep 16, 15366 (2026). https://doi.org/10.1038/s41598-026-46342-y

关键词: 肝脏分割, CT 扫描, 深度学习, Transformer 网络, 医学影像