Clear Sky Science · ru

Иерархическая агрегация контекстной информации для сегментации полипов

· Назад к списку

Почему небольшие разрастания в толстой кишке важны

Колоректальный рак часто начинается с небольших, на первый взгляд безобидных выпячиваний — полипов на слизистой оболочке толстой кишки. Во время колоноскопии врачи пытаются обнаружить и удалить эти образования до того, как они станут опасными. Но люди устают, изображение не всегда идеальное, и исследования показывают, что до четверти полипов может быть пропущено. В этой работе представлен новый искусственный интеллект (ИИ), разработанный для автоматического выделения полипов на изображениях колоноскопии с высокой точностью, с целью стать надежным помощником, который помогает врачам видеть больше и пропускать меньше.

Figure 1
Figure 1.

Видеть и лес, и деревья

Современные инструменты ИИ для медицинских изображений обычно делятся на два лагеря. Один, основанный на классических сверточных нейронных сетях, отлично распознаёт мелкие локальные детали — такие как тонкие края или изменения текстуры — но слабо понимает взаимосвязи между удалёнными участками изображения. Другой, основанный на трансформерах, превосходен в улавливании дальнодействующих связей — «большой картины» по всему изображению — но может терять чёткость вокруг мелких структур, например тонких границ полипов, и требовать больших вычислительных ресурсов. Недавние гибридные системы пытаются сочетать оба подхода, однако часто в итоге отдают предпочтение сверточной части и не в полной мере используют механизмы внимания, что приводит к размытым краям и утрате контекста.

Новый способ объединять подсказки на разных масштабах

Авторы предлагают сеть под названием Hierarchical Contextual Information Aggregation (HCIA), чтобы преодолеть эти ограничения. HCIA спроектирована так, чтобы одновременно анализировать изображение колоноскопии на нескольких уровнях детализации — от грубых, отдалённых представлений до тонких, увеличенных — и позволять этим уровням обмениваться информацией в структурированной форме. Одним из ключевых компонентов, Hierarchical Aggregation Module (HAM), объединяет данные с соседних уровней. Смешивая грубый контекст с более точными деталями, HAM помогает системе отличать полипы от фоновой ткани с различными цветами, формами и размерами, одновременно уточняя границы между полипом и здоровой тканью.

Разумное внимание без тяжёлых вычислений

Второй важный элемент, Interconnected Attention Module (IAM), решает задачу глобального контекста. Вместо привычного способа вычисления внимания — сравнения каждого пикселя с каждым другим, что быстро становится вычислительно затратным — IAM использует общую «память», которая резюмирует то, что сеть узнала на всех уровнях. Каждый уровень обращается к этой памяти, чтобы решить, какие части его признаков заслуживают большего внимания. Такая конструкция позволяет IAM строить дальнодействующие связи по всему изображению, сохраняя при этом контроль над вычислительными затратами. Важно, что та же память используется во всех ветвях сети, обеспечивая форму согласованного глобального контроля, которая помогает модели сосредотачиваться на полипах независимо от их размера или положения.

Figure 2
Figure 2.

Испытание системы

Чтобы проверить, имеет ли дизайн HCIA практическое значение, авторы протестировали её на трёх широко используемых коллекциях изображений полипов, каждая из которых содержит от нескольких сотен до тысячи кадров колоноскопии с размеченными экспертами контурами полипов. Они сравнили HCIA более чем с двадцатью ведущими моделями ИИ, включая как традиционные сверточные сети, так и более новые гибриды на базе трансформеров. По почти всем показателям — насколько предсказанные области полипов совпадают с разметкой экспертов, насколько точно воспроизводятся формы и насколько хорошо выравниваются структуры — HCIA оказалась лучшей или сравнялась с лучшими конкурентами. Она особенно уверенно показала себя при межнаборных тестах, что является требовательной ситуацией, имитирующей работу инструмента в разных клиниках с разным оборудованием и условиями съёмки. Детальные визуальные сравнения показали, что HCIA более надёжно фиксирует неправильные формы полипов и слабовыраженные границы по сравнению с соперниками.

Что это значит для пациентов и клиницистов

Для широкой аудитории главный вывод в том, что HCIA — это ИИ-система, которая точнее выделяет потенциально злокачественные образования на изображениях колоноскопии и при этом работает достаточно быстро для использования в реальном времени. Объединяя чёткие локальные детали с сильным пониманием общего контекста и делая это эффективно, она снижает риск того, что тонкие или неправильно сформированные полипы останутся незамеченными. Хотя модель всё ещё требует дальнейшей оптимизации для очень лёгких устройств и пока не использует информацию из последовательностей видео во времени, она представляет собой значимый шаг к более умной и надёжной компьютерной поддержке скрининга колоректального рака — помогая врачам обнаруживать более опасные разрастания до того, как они станут угрозой для жизни.

Цитирование: Li, L., Yang, H., Zhang, J. et al. Hierarchical contextual information aggregation for polyp segmentation. Sci Rep 16, 5959 (2026). https://doi.org/10.1038/s41598-026-35703-2

Ключевые слова: колоректальные полипы, ИИ для колоноскопии, сегментация медицинских изображений, глубокое обучение, раннее обнаружение рака