Clear Sky Science · ru
CFG‑MambaNet: Контекстно- и частотно-ориентированная сеть Mamba для сегментации медицинских изображений
Почему важны более четкие медицинские изображения
Когда врачи просматривают снимки сердца, изображения колоноскопии, фотографии кожи или микропрепараты тканей, им часто нужна помощь компьютера, чтобы точно очертить, где начинается и заканчивается опухоль, орган или подозрительное пятно. Эта операция — сегментация — лежит в основе диагноза, планирования лечения и даже решений о проведении операции. В статье представлена CFG‑MambaNet, новая система искусственного интеллекта (ИИ), созданная для того, чтобы проводить такие обводки точнее и надежнее для разных типов медицинских изображений.

Проблема точного проведения границ
Современные инструменты ИИ уже умеют маркировать медицинские изображения, но они испытывают трудности в сложных ситуациях, которые часто встречаются в клинике. Некоторые методы рассматривают только небольшие участки пикселей одновременно и теряют более широкую картину. Другие видят всё изображение целиком, но требуют огромных вычислительных ресурсов, что затрудняет работу с крупными детализированными сканами. Многие плохо справляются, когда область интереса блеклая, размытая, очень маленькая или необычной формы. В результате традиционные системы могут отрезать часть стенки сердца, неверно оценить размер полипа в толстом кишечнике или пропустить тонкий край кожного поражения — ошибки, которые приводят к неверным измерениям или задержке диагноза.
Новый способ, чтобы ИИ видел всю картину
CFG‑MambaNet решает эти проблемы, по-новому организуя «взгляд» сети на изображение. В основе лежит блок визуального пространства состояний, основанный на недавней архитектуре Mamba. Вместо того чтобы сравнивать каждый пиксель со всеми другими — дорогостоящая операция в многих моделях на основе Transformer — этот блок сканирует изображение упорядоченно, отслеживая дальние взаимосвязи при значительно меньших вычислительных затратах. Это позволяет сети понимать, как отдалённые части изображения соотносятся друг с другом, например полную форму желудочка на снимке сердца, без существенного замедления при работе с высокоразрешёнными данными.
Разделение общей формы и тонких деталей
Вторая идея CFG‑MambaNet — рассматривать изображение как музыкальное произведение с низкими и высокими нотами. В модуле частотно-ориентированного представления ИИ разделяет информацию изображения на плавно меняющиеся компоненты (которые фиксируют общую форму органа) и быстрые изменения (которые фиксируют края и текстуры). Отдельная корректировка этих частей с последующим объединением позволяет системе улучшать размытые границы, сохраняя при этом правильную крупномасштабную структуру. Это особенно полезно для поражений, края которых сливаются с фоном, как некоторые кожные пятна или тонкие изменения тканей на гистологических срезах.

Адаптация к крошечным пятнам и крупным структурам
В медицинских изображениях часто сочетаются очень крупные и очень мелкие структуры: целое сердце и тонкая стенка, широкий вид толстого кишечника и крошечный полип. CFG‑MambaNet включает модуль мультимасштабной адаптивной агрегации контекста, который изучает сцену одновременно через несколько «уровней увеличения». Одна ветвь сосредоточена на широкой фоновой структуре, другая гибко отслеживает неправильные формы, а третья улавливает среднеразмерные паттерны. Сеть обучается определять, насколько доверять каждому уровню увеличения в разных ситуациях, подсвечивая наиболее важные области. Дополнительные приёмы обучения — такие как комбинированная функция потерь, уравновешивающая точность областей и чёткость краёв, и супервизия на нескольких глубинах сети — помогают стабилизировать обучение и ещё более точно выделять границы.
Доказанный прирост качества на четырёх типах медицинских изображений
Чтобы оценить CFG‑MambaNet, авторы протестировали её на четырёх публичных наборах данных: магнитно-резонансных изображениях сердца, кадрах колоноскопии, фотографиях кожных поражений и микроскопических препаратах патологии. Во всех четырёх задачах новый метод превысил широкий круг ведущих моделей сегментации, включая классические свёрточные сети, системы на основе Transformer и другие варианты Mamba. Он показал лучшее перекрытие предсказанных и реальных областей, меньшую среднюю дистанцию между предсказанными и фактическими границами и более высокую чувствительность к трудноразличимым поражениям. Это означает более чёткие контуры полостей сердца, более точные маски полипов в кишечнике, ясные границы неправильных кожных поражений и более верное выделение раковой ткани в микроскопе.
Что это значит для будущей медицины
С точки зрения непрофессионала, CFG‑MambaNet — это более умный и более эффективный «помощник по обводке» для врачей. Видя и общую картину, и мелкие детали, и работая хорошо на нескольких очень разных типах изображений, он приближает автоматическую сегментацию к рутинному клиническому применению. Хотя требуется дополнительная проверка на больших реальных популяциях пациентов, этот подход в конечном итоге может поддержать более надёжные измерения, более раннее выявление заболеваний и лучшее планирование лечения в кардиологии, гастроэнтерологии, дерматологии и онкологии.
Цитирование: Ren, G., Chen, Z., Su, P. et al. CFG-MambaNet: Contextual and Frequency-Guided Mamba Network for medical image segmentation. npj Digit. Med. 9, 202 (2026). https://doi.org/10.1038/s41746-026-02393-z
Ключевые слова: сегментация медицинских изображений, глубокое обучение, сеть Mamba, мультимасштабная визуализация, клиническая диагностика