Clear Sky Science · ru
InfoColon: набор данных для последовательных информативных кадров в колоноскопии
Почему важны более чёткие видео колоноскопии
Колоноскопия — один из основных инструментов для обнаружения ранних признаков колоректального рака, однако получаемые видео часто бывают захламлёнными. Многие кадры размыты, закрыты пузырьками или инструментами, либо просто показывают однородную стенку ткани. Эти бесполезные моменты замедляют врачей и сбивают с толку компьютерные программы, которые должны им помогать. В этом исследовании представлен InfoColon — новая общедоступная коллекция видео колоноскопии, разработанная, чтобы отделять полезные виды от бесполезных и помогать создавать более надёжные медицинские ИИ‑системы.
Очистка шумного медицинского видеопотока
Во время колоноскопии камера движется по извилистому, влажному и подвижному органу. По мере продвижения и извлечения зонда изображение может дрожать, запотевать или заполняться бликами от света. Авторы отмечают, что такие неинформативные кадры затрудняют поиск полипов, повышают усталость клиницистов и удлиняют процедуры для пациентов. Они утверждают, что возможность быстро выделять информативные кадры, где внутренний просвет кишки и его структуры хорошо видны, улучшит диагностику, позволит проводить автоматические проверки качества и поддержит новые инструменты, такие как 3D‑карты кишки и навигационные подсказки. До сих пор не существовало крупного публичного набора данных для обучения и сравнения таких методов.

Новая общая библиотека видов кишки
Исследователи создали InfoColon, объединив реальные видеозаписи колоноскопий из двух больниц с несколькими известными публичными коллекциями изображений. Из клинических обследований они собрали более 119 000 кадров с частотой выборки один раз в секунду, а затем добавили десятки тысяч кадров из существующих исследовательских наборов. Каждый кадр был промаркирован экспертами‑эндоскопистами как информативный или относящийся к одному из шести типов неинформативных кадров: однородная стенка, пузырьки, размытие, плохое освещение, инструмент в кадре или другие препятствия, например каловые массы. Проверки на выборке кадров показали сильное согласие между экспертами, что даёт уверенность в надёжности меток. Наряду с видео команда предоставляет сводные отчёты, показывающие распределение информативных кадров во времени в каждой процедуре.
Обучение компьютеров фокусироваться на важном
Разметка столь большого количества кадров вручную была бы дорогой и медленной, поэтому команда протестировала стратегии обучения, которые позволяют максимально эффективно использовать меньший набор размеченных примеров. Они сравнили стандартное контролируемое обучение с полуконтролируемыми и методами активного обучения, которые просят экспертов маркировать только наиболее полезные новые образцы. Их новый метод, названный Accuracy Driven Adaptive Threshold BALD, выбирает кадры для экспертной проверки, основываясь на том, насколько изменяется производительность модели, а не только на уровне её неопределённости. С использованием современного визуального трансформера они показали, что такой подход может достигать высокой точности в разделении информативных и неинформативных кадров в разных схемах меток, потребляя при этом гораздо меньше экспертно размеченных изображений, чем традиционное обучение.
От плоских видеокадров к 3D‑картам
InfoColon — это не только список чистых кадров. Набор данных также включает видео для калибровки камеры и параметры, корректирующие искажение широкоугольного объектива колоноскопа. Имея эти данные, авторы использовали только информативные кадры для тестирования методов 3D‑реконструкции, которые преобразуют 2D‑изображения в 3D‑точечное облако поверхности кишки. В примерах полученные 3D‑модели воспроизводили важные формы — складки, изгибы и текстуру — и демонстрировали плавные переходы от кадра к кадру. Это указывает на то, что хорошо отфильтрованный поток кадров может поддержать будущие инструменты для навигации зонда, оценки покрытия или помощи в обнаружении пропущенных областей.

Что это значит для пациентов и исследователей
Для неспециалиста InfoColon можно представить как тщательно организованную библиотеку, которая сохраняет чёткие изображения и помечает бесполезные, а также фиксирует поведение камеры. Этот общий ресурс должен упростить исследователям по всему миру создание и честное сравнение программ, которые очищают, анализируют или реконструируют видео колоноскопии. В долгосрочной перспективе такой прогресс может помочь врачам с более качественными проверками и информативными видами кишки, не меняя саму процедуру для пациентов.
Цитирование: Choi, T., Moon, H.S., Jang, S. et al. InfoColon: A dataset for consecutive informative frames in Colonoscopy. Sci Data 13, 748 (2026). https://doi.org/10.1038/s41597-026-07060-2
Ключевые слова: колоноскопия, медицинская визуализация, видеоанализ, набор данных, активное обучение