Clear Sky Science · ru

Параллельный UNet, объединяющий KAN и mamba для сегментации медицинских изображений

· Назад к списку

Почему это важно для пациентов и врачей

За каждым скрининговым снимком на предмет рака или ультразвуковым изображением стоит важная задача — научить компьютеры очерчивать, где именно находится патологическое образование или орган. Этот процесс, называемый сегментацией, помогает врачам измерять опухоли, отслеживать развитие заболевания и планировать лечение. В статье представлен KMP-UNet — новый компактный сетевой подход к анализу изображений, который обещает более точно и эффективно восстанавливать эти границы, потенциально делая автоматическое чтение медицинских изображений более надёжным и проще внедряемым в реальной клинической практике.

Figure 1
Figure 1.

Видеть картину целиком на медицинском снимке

Современные медицинские изображения большие и сложные: важные признаки могут быть распределены по большой области, а само поражение иметь размытые или неправильные границы. Традиционные сверточные нейронные сети, в том числе популярная семья UNet, хорошо улавливают локальные паттерны, но испытывают трудности при установлении связей между отдалёнными регионами снимка. Модели на базе трансформеров способны охватить всё изображение сразу, но обычно тяжёлые и медленные, что проблематично для высокоразрешённых клинических данных и ограниченного оборудования в больницах. Авторы опираются на более современное семейство последовательных моделей — модели состояния пространства — и на новый тип нейросетей, известный как сети Колмогорова–Арнольда, чтобы одновременно захватывать широкий контекст и тонкие детали без вздутия вычислений.

Два «умных» специалиста, работающие бок о бок

KMP-UNet сохраняет привычную U‑образную архитектуру кодера‑декодера UNet, но меняет внутреннюю обработку. Вместо одного типа обработки сеть запускает две параллельные ветви. Одна ветвь основана на модели под названием Mamba, которая хорошо справляется с длинными последовательностями и здесь адаптирована для сканирования по изображению. Эта ветвь эффективно собирает дальнодействующий контекст, помогая сети понимать взаимосвязи между удалёнными областями. Вторая ветвь использует сети Колмогорова–Арнольда, которые заменяют фиксированные функции активации гибкими обучаемыми кривыми. Это даёт модели дополнительные возможности для представления сложных нелинейных закономерностей, например тонких изменений интенсивности вдоль границы кожного поражения или полипа.

Более умное объединение признаков и чёткие границы

Просто склеить разные типы моделей — этого недостаточно; настоящая задача — как совместить их сильные стороны. В этой связи авторы предлагают Parallel Convolution Mamba Block (PCMB), который делит признаки на группы и прогоняет их через несколько лёгких путей на базе Mamba и свёрток, прежде чем снова объединить. Такая конструкция уравновешивает глобальный контекст и тонкую детализацию при низких вычислительных затратах. Авторы также пересматривают пропуски (skip connections), связывающие кодер и декодер. Новый модуль Enhanced Spatial-Channel Attention (ESCA) выборочно усиливает важные пространственные положения и каналы признаков, сохраняя полезную информацию через остаточные соединения. Это делает сеть менее подверженной помехам типа волос, бликов или шумных текстур вокруг очага.

Figure 2
Figure 2.

Насколько хорошо работает новый подход?

Команда оценила KMP-UNet на четырёх общедоступных наборах данных по кожным поражениям, колоректальным полипам и маммографическим/ультразвуковым изображениям груди, а также протестировала переносимость на другом наборе по коже. По этим бенчмаркам модель последовательно сравнивается и часто превосходит ряд сильных базовых методов, включая классические варианты UNet, архитектуры на базе трансформеров и другие недавние сети с улучшениями на базе Mamba и KAN. Например, на широко используемом наборе по кожным поражениям (ISIC2018) KMP-UNet достигает высокого показателя Dice и точности, используя порядка одного миллиона параметров — значительно меньше, чем у многих конкурентов. Подробные эксперименты показывают, что каждая составляющая — моделирование контекста на базе Mamba, нелинейная доработка на базе KAN и улучшение пропусков через ESCA — даёт измеримый вклад, особенно в качестве границ и снижении ложноположительных областей.

Что это значит для будущих медицинских инструментов ИИ

Для неспециалистов главный вывод таков: KMP-UNet предлагает более компактный, но способный способ научить компьютеры очерчивать поражения и органы на изображениях, позволяя двум дополняющим друг друга «экспертам» работать параллельно и затем аккуратно объединять их выводы. Хотя метод по‑прежнему испытывает трудности с самыми сложными случаями — очень неправильными формами, крайне размытыми границами или сильными артефактами — он даёт прочную основу для точной и эффективной сегментации. При дальнейшем развитии методов обработки шумных фонов и адаптации между клиниками подходы вроде KMP-UNet могут приблизить надёжный и быстрый анализ изображений к повседневной клинической практике.

Цитирование: Liu, J., Wu, J., Xu, L. et al. A parallel UNet integrating KAN and mamba for medical image segmentation. Sci Rep 16, 13579 (2026). https://doi.org/10.1038/s41598-026-43127-1

Ключевые слова: сегментация медицинских изображений, глубокое обучение, UNet, модели состояния пространства, сети Колмогорова–Арнольда