Clear Sky Science · zh
CFG-MambaNet:用于医学图像分割的上下文与频率引导 Mamba 网络
更清晰的医学影像为何重要
当医生检查心脏扫描、结肠镜图像、皮肤照片或组织切片时,常需要计算机帮助精确勾画肿瘤、器官或可疑区域的起止位置。这个勾画步骤称为分割,是诊断、治疗规划乃至手术决策的基础。本文提出了 CFG‑MambaNet,一种新的人工智能(AI)系统,旨在对多种医学影像更准确、更可靠地绘制这些边界。

绘制精确边界的挑战
现代 AI 工具已经可以为医学影像打标签,但在临床常见的棘手情形中仍会失误。一些方法一次只看到像素的小邻域,因此忽略了更大的整体信息;另一些方法虽能一次观测整张图像,但计算量巨大,在处理大分辨率扫描时难以实用。很多方法在目标区域模糊、微小或形状异常时表现欠佳。结果是传统系统可能切掉心壁的一部分、错估结肠息肉大小,或忽视皮损的细薄边缘——这些错误会导致测量不准或延误诊断。
让 AI 更好地“看见”整体
CFG‑MambaNet 通过重新设计网络对图像的“观察”方式来应对这些问题。其核心是基于一种近期架构 Mamba 的视觉状态空间模块。与许多基于 Transformer 的模型需要逐像素两两比对(代价高昂)不同,该模块以有序方式在图像上扫描,用更低的计算量记录远程模式。这使得网络能理解图像中相距较远部分的相互关系,例如心脏扫描中整个心室的形状,同时在高分辨率数据上保持计算效率。
将整体形状与细节分离
CFG‑MambaNet 的第二个思路是把图像比作一段音乐,有低音和高音。在频率引导表示模块中,AI 将图像信息拆分为平滑且变化缓慢的成分(捕捉器官的整体形状)和快速变化的成分(捕捉边缘与纹理)。通过分别调节这两部分再重组,系统可以在保持大结构正确的同时锐化模糊边界。对于那些边缘逐渐融入背景的病变(如某些皮肤斑点或病理切片中细微的组织变化),这一点尤其有用。

适应微小病灶与大型结构
医学影像常同时包含非常大与非常小的结构:完整的心脏与薄薄的心壁、宽阔的结肠视野与微小的息肉。CFG‑MambaNet 包含一个多尺度自适应上下文聚合模块,同时以多个“变焦级别”观察场景。一个分支关注广阔的背景结构,另一个灵活追踪不规则形状,第三个捕捉中尺度模式。网络随后学习在不同情形下应多信任哪个变焦级别,从而突出最重要的区域。额外的训练技巧——例如平衡区域准确性与边缘清晰度的组合损失函数,以及在网络多层次的监督——有助于稳定训练并进一步细化边界。
在四类医学影像上的验证收益
为了测试 CFG‑MambaNet,作者在四个公开数据集上进行了评估,涵盖心脏 MRI、结肠镜图像、皮肤病变照片和显微病理切片。在这四种场景中,新方法均优于多种领先的分割模型,包括经典卷积网络、基于 Transformer 的系统以及其他 Mamba 风格设计。它在预测与真实区域的重叠度、更小的平均边界距离以及对难以察觉病变的敏感性上表现更好。这意味着心腔轮廓更清晰、结肠息肉掩膜更准确、皮肤不规则病变边界更明晰,以及显微镜下癌变组织的描绘更忠实。
对未来护理的意义
从外行角度看,CFG‑MambaNet 是对医生的更聪明、更高效的“勾画助手”。通过兼顾整体与细节,并在多种迥异的影像类型上都能良好运行,它使自动分割更接近常规临床应用。尽管仍需在更大规模、真实世界的患者群体中进一步测试,这一方法最终有望支持更可靠的测量、更早的疾病发现,以及在心脏病学、胃肠病学、皮肤科和肿瘤护理中的更佳治疗规划。
引用: Ren, G., Chen, Z., Su, P. et al. CFG-MambaNet: Contextual and Frequency-Guided Mamba Network for medical image segmentation. npj Digit. Med. 9, 202 (2026). https://doi.org/10.1038/s41746-026-02393-z
关键词: 医学图像分割, 深度学习, Mamba 网络, 多尺度成像, 临床诊断