Clear Sky Science · ru

Многоуровневое внимание DeepLab V3+ с EfficientNetB0 для сегментации органов ЖКТ на МРТ

· Назад к списку

Более точная прицельность по опухолям

Когда врачи лечат злокачественные новообразования пищеварительной системы с помощью радиации, им приходится находить тонкий баланс: максимально воздействовать на опухоль и при этом беречь рядом расположенные здоровые органы — желудок и кишечник. Сегодня ручное очерчивание этих органов на каждом снимке магнитно-резонансной томографии (МРТ) может занимать до часа на пациента в день. В этой работе представлен система компьютерного зрения, автоматически выделяющая эти органы на МРТ, что обещает более быстрое и точное планирование лечения и меньше побочных эффектов для пациентов.

Почему важно картирование кишечника

Рак желудочно-кишечного тракта встречается часто и нередко оказывается смертельным: общая выживаемость составляет порядка 30 процентов. Лучевая терапия — ключевой метод лечения, но пищеварительный тракт плотно упакован в брюшной полости, и здоровые органы могут смещаться чуть-чуть из дня в день. Чтобы не повредить желудок, тонкий и толстый кишечник, врачам нужно точно видеть их расположение перед каждой сессией. Ручное очерчивание медленное и подвержено вариабельности между специалистами. Автоматический, надежный способ построения этих границ мог бы сократить время приёма, позволить лечить больше пациентов и повысить безопасность и точность доз лучевой терапии.

Figure 1
Figure 1.

Обучение компьютеров «читать» МРТ

Исследователи разработали модель искусственного интеллекта, которая обучается распознавать три ключевых органа пищеварительной системы на МРТ: желудок, тонкую и толстую кишку. Они тренировали её на наборе данных UW–Madison GI Tract — единственной публичной коллекции с подробными контурами органов на абдоминальных МРТ. В набор входят 38 496 изображений от 85 пациентов, а также тщательно подготовленные метки, указывающие, где присутствует каждый орган или где орган отсутствует. Чтобы максимально использовать относительно небольшой объем данных, команда разбила выборку по пациентам (чтобы модель никогда не видела одного и того же человека и в обучении, и в тесте) и расширила набор с помощью переворотов, поворотов, повышения яркости и мягких деформаций изображений. Эти контролируемые изменения помогают системе справляться с реальными вариациями положения пациента, яркости снимков и тонких различий форм.

Как новая ИИ-модель видит паттерны

Внутри модели несколько идей из современной обработки изображений объединены, чтобы «уточнить» её восприятие анатомии. Сначала компактная сеть EfficientNet B0 просматривает каждое изображение и накапливает уровни визуальных признаков — от простых краёв до сложных форм органов — при умеренных вычислительных затратах. Затем структура DeepLab V3+ рассматривает изображение на нескольких масштабах, как будто приближая и отдаляя, чтобы понять и тонкие детали, и общий контекст. Поверх этого авторы добавляют механизм «внимания» на нескольких уровнях детализации. Проще говоря, внимание помогает системе решить, каким частям изображения и каким внутренним сигналам придавать больше веса, чтобы сконцентрироваться на тонких, но важных признаках, отличающих, например, желудок от петель тонкой кишки. Наконец, декодер собирает эти подсказки в единое аккуратное полноразмерное масочное отображение трёх органов.

Figure 2
Figure 2.

Проверка точности и эффективности

Команда систематически настраивала процесс обучения — пробуя разные оптимизаторы, число эпох и способы разбиения данных для валидации. Лучшая конфигурация использовала оптимизатор RMSprop, четырёхкратную кросс-валидацию и 30 циклов обучения. На отложенных тестовых пациентах модель правильно классифицировала более 99 процентов пикселей в целом и демонстрировала очень сильное совпадение с контурами, нарисованными экспертами. Популярная метрика перекрытия Dice достигла примерно 94 процентов в среднем по трём органам, а связанная мера Intersection over Union — около 92 процентов. Не менее важно для клинического применения, система относительно лёгкая: в ней около 8,3 миллиона настраиваемых параметров, и она может обработать типичный срез МРТ 224×224 примерно за 31 миллисекунду, что достаточно быстро для почти реального времени при ежедневном планировании лечения.

Что это значит для пациентов

По сути, исследование показывает, что тщательно спроектированная ИИ-система может надёжно очерчивать желудок и кишечник на МРТ, сопоставимо с работой экспертов, работая гораздо быстрее и стабильнее. Такая возможность может помочь радиационным онкологам точнее нацеливать лучи вокруг чувствительных тканей, снижая нежелательные повреждения и побочные эффекты лечения. Хотя текущая модель обучена на снимках из одного центра и в основном на здоровой анатомии, она даёт прочную основу для будущих систем, которые учтут поражённые органы и данные из нескольких больниц. При дальнейшем тестировании и доработке такие инструменты могут стать рутинными помощниками в кабинете планирования лучевой терапии, незаметно обеспечивая, что жизненно важные облучения попадают именно туда, где это наиболее нужно.

Цитирование: Sharma, N., Gupta, S., Al-Yarimi, F.A.M. et al. Multi-level attention DeepLab V3+ with EfficientNetB0 for GI tract organ segmentation in MRI scans. Sci Rep 16, 7546 (2026). https://doi.org/10.1038/s41598-026-38247-7

Ключевые слова: рак желудочно-кишечного тракта, сегментация МРТ, планирование лучевой терапии, глубокое обучение в медицине, анализ медицинских изображений