Clear Sky Science · ru

CFG‑MambaNet: Контекстно- и частотно-ориентированная сеть Mamba для сегментации медицинских изображений

· Назад к списку

Почему важны более четкие медицинские изображения

Когда врачи просматривают снимки сердца, изображения колоноскопии, фотографии кожи или микропрепараты тканей, им часто нужна помощь компьютера, чтобы точно очертить, где начинается и заканчивается опухоль, орган или подозрительное пятно. Эта операция — сегментация — лежит в основе диагноза, планирования лечения и даже решений о проведении операции. В статье представлена CFG‑MambaNet, новая система искусственного интеллекта (ИИ), созданная для того, чтобы проводить такие обводки точнее и надежнее для разных типов медицинских изображений.

Figure 1
Figure 1.

Проблема точного проведения границ

Современные инструменты ИИ уже умеют маркировать медицинские изображения, но они испытывают трудности в сложных ситуациях, которые часто встречаются в клинике. Некоторые методы рассматривают только небольшие участки пикселей одновременно и теряют более широкую картину. Другие видят всё изображение целиком, но требуют огромных вычислительных ресурсов, что затрудняет работу с крупными детализированными сканами. Многие плохо справляются, когда область интереса блеклая, размытая, очень маленькая или необычной формы. В результате традиционные системы могут отрезать часть стенки сердца, неверно оценить размер полипа в толстом кишечнике или пропустить тонкий край кожного поражения — ошибки, которые приводят к неверным измерениям или задержке диагноза.

Новый способ, чтобы ИИ видел всю картину

CFG‑MambaNet решает эти проблемы, по-новому организуя «взгляд» сети на изображение. В основе лежит блок визуального пространства состояний, основанный на недавней архитектуре Mamba. Вместо того чтобы сравнивать каждый пиксель со всеми другими — дорогостоящая операция в многих моделях на основе Transformer — этот блок сканирует изображение упорядоченно, отслеживая дальние взаимосвязи при значительно меньших вычислительных затратах. Это позволяет сети понимать, как отдалённые части изображения соотносятся друг с другом, например полную форму желудочка на снимке сердца, без существенного замедления при работе с высокоразрешёнными данными.

Разделение общей формы и тонких деталей

Вторая идея CFG‑MambaNet — рассматривать изображение как музыкальное произведение с низкими и высокими нотами. В модуле частотно-ориентированного представления ИИ разделяет информацию изображения на плавно меняющиеся компоненты (которые фиксируют общую форму органа) и быстрые изменения (которые фиксируют края и текстуры). Отдельная корректировка этих частей с последующим объединением позволяет системе улучшать размытые границы, сохраняя при этом правильную крупномасштабную структуру. Это особенно полезно для поражений, края которых сливаются с фоном, как некоторые кожные пятна или тонкие изменения тканей на гистологических срезах.

Figure 2
Figure 2.

Адаптация к крошечным пятнам и крупным структурам

В медицинских изображениях часто сочетаются очень крупные и очень мелкие структуры: целое сердце и тонкая стенка, широкий вид толстого кишечника и крошечный полип. CFG‑MambaNet включает модуль мультимасштабной адаптивной агрегации контекста, который изучает сцену одновременно через несколько «уровней увеличения». Одна ветвь сосредоточена на широкой фоновой структуре, другая гибко отслеживает неправильные формы, а третья улавливает среднеразмерные паттерны. Сеть обучается определять, насколько доверять каждому уровню увеличения в разных ситуациях, подсвечивая наиболее важные области. Дополнительные приёмы обучения — такие как комбинированная функция потерь, уравновешивающая точность областей и чёткость краёв, и супервизия на нескольких глубинах сети — помогают стабилизировать обучение и ещё более точно выделять границы.

Доказанный прирост качества на четырёх типах медицинских изображений

Чтобы оценить CFG‑MambaNet, авторы протестировали её на четырёх публичных наборах данных: магнитно-резонансных изображениях сердца, кадрах колоноскопии, фотографиях кожных поражений и микроскопических препаратах патологии. Во всех четырёх задачах новый метод превысил широкий круг ведущих моделей сегментации, включая классические свёрточные сети, системы на основе Transformer и другие варианты Mamba. Он показал лучшее перекрытие предсказанных и реальных областей, меньшую среднюю дистанцию между предсказанными и фактическими границами и более высокую чувствительность к трудноразличимым поражениям. Это означает более чёткие контуры полостей сердца, более точные маски полипов в кишечнике, ясные границы неправильных кожных поражений и более верное выделение раковой ткани в микроскопе.

Что это значит для будущей медицины

С точки зрения непрофессионала, CFG‑MambaNet — это более умный и более эффективный «помощник по обводке» для врачей. Видя и общую картину, и мелкие детали, и работая хорошо на нескольких очень разных типах изображений, он приближает автоматическую сегментацию к рутинному клиническому применению. Хотя требуется дополнительная проверка на больших реальных популяциях пациентов, этот подход в конечном итоге может поддержать более надёжные измерения, более раннее выявление заболеваний и лучшее планирование лечения в кардиологии, гастроэнтерологии, дерматологии и онкологии.

Цитирование: Ren, G., Chen, Z., Su, P. et al. CFG-MambaNet: Contextual and Frequency-Guided Mamba Network for medical image segmentation. npj Digit. Med. 9, 202 (2026). https://doi.org/10.1038/s41746-026-02393-z

Ключевые слова: сегментация медицинских изображений, глубокое обучение, сеть Mamba, мультимасштабная визуализация, клиническая диагностика