Clear Sky Science · zh
一种将 KAN 与 mamba 并行集成用于医学图像分割的 UNet
这对患者和医生为何重要
在每一次癌症筛查或超声检查的图像背后,一个关键步骤是教计算机勾画病灶或器官的实际位置。这个过程称为分割,能帮助医生测量肿瘤、追踪病情并制定治疗方案。论文提出了 KMP-UNet,一种新的紧凑型图像分析网络,承诺能更准确高效地勾画这些边界,可能使自动化医学图像解读更可靠,并更容易在真实临床中部署。

在医学扫描中看清整体
现代医学影像既大又复杂:重要线索可能分布在广泛区域,而病灶本身边缘可能模糊或不规则。传统卷积神经网络(包括流行的 UNet 系列)擅长捕捉局部模式,但难以将扫描中遥远区域连接起来。基于 Transformer 的模型可以一次性看到整个图像,但通常体积较大且运行缓慢,这对高分辨率的临床数据和医院有限的硬件资源是个问题。作者构建在一种更新的序列模型家族之上,称为状态空间模型,并采用一种新型神经网络——Kolmogorov–Arnold 网络,以在不大幅增加计算量的情况下同时捕捉全局上下文和微妙细节。
两个智能专长并肩工作
KMP-UNet 保持了熟悉的 U 形编码器—解码器布局,但改变了内部处理方式。它并不依赖单一类型的处理,而是在网络中并行运行两条分支。其中一条基于称为 Mamba 的模型,擅长处理长序列,这里被改造用于跨图像扫描。这条分支高效收集远程上下文,帮助网络理解相距较远区域之间的关联。第二条分支使用 Kolmogorov–Arnold 网络,将固定的激活函数替换为可学习的灵活曲线,从而赋予模型额外能力来表示复杂的非线性模式,例如皮肤病变或息肉边缘的细微强度变化。
更聪明的特征融合与更清晰的边界
简单地把不同模型类型拼接在一起并不足够;真正的挑战在于如何结合它们的优势。为此,作者引入了并行卷积 Mamba 模块(Parallel Convolution Mamba Block,PCMB),将特征划分为若干组,通过若干轻量的基于 Mamba 和卷积的路径分别处理后再融合回去。该设计在保持计算成本低的同时平衡了全局上下文与精细细节。他们还重新设计了将编码器与解码器相连的跳跃连接。新的增强空间-通道注意力模块(Enhanced Spatial-Channel Attention,ESCA)有选择地强调重要位置和特征通道,同时通过残差连接保留有用信息。这使得网络不易被头发、眩光或病灶周围嘈杂纹理等干扰所迷惑。

新方法表现如何?
团队在四个公开数据集上评估了 KMP-UNet,涵盖皮肤病变、结肠息肉和乳腺超声图像,并测试了向另一个皮肤数据集的迁移能力。在这些基准上,该模型稳定地达到或超过了多种强基线的表现,包括经典 UNet 变体、基于 Transformer 的设计以及其他近期的 Mamba 和 KAN 强化网络。例如,在广泛使用的皮肤病变数据集(ISIC2018)上,KMP-UNet 在保持约一百万参数(远少于许多竞争模型)的同时,实现了较高的 Dice 分数和准确率。详尽的实验表明,每个组件——基于 Mamba 的上下文建模、基于 KAN 的非线性精化以及基于 ESCA 的跳跃连接精化——都带来了可测量的提升,尤其体现在边界质量和减少假阳性区域上。
这对未来医学 AI 工具意味着什么
对非专业读者而言,关键结论是 KMP-UNet 提供了一种更紧凑但更有能力的方法,通过让两个互补的“专家”并行工作并谨慎融合它们的见解,教计算机在图像中勾画病变和器官。虽然该方法在最具挑战性的案例中仍有困难——非常不规则的形状、极度模糊的边界或严重的伪影——但它为准确且高效的分割提供了坚实基础。通过在处理嘈杂背景和跨影像中心自适应方面的进一步工作,像 KMP-UNet 这样的方案有望将可靠、快速的图像分析更接近日常临床实践。
引用: Liu, J., Wu, J., Xu, L. et al. A parallel UNet integrating KAN and mamba for medical image segmentation. Sci Rep 16, 13579 (2026). https://doi.org/10.1038/s41598-026-43127-1
关键词: 医学图像分割, 深度学习, UNet, 状态空间模型, Kolmogorov–Arnold 网络