Clear Sky Science · ru

Контекстно-анатомически направленное глубокое обучение для точной сегментации фовеа на фундус‑снимках при диабетической ретинопатии

2026-02-24 · Назад к списку

Видеть опасность в глазах людей с диабетом

Для миллионов людей с диабетом небольшое пятно в самом центре сетчатки — фовеа — может означать разницу между чётким зрением и необратимой потерей зрения. Врачи уже используют цветные фотографии заднего полюса глаза (фундус‑изображения) для скрининга диабетической ретинопатии, одной из ведущих причин предотвратимой слепоты. Но современные автоматические инструменты чаще отмечают фовеа одной точкой, а не выделяют её реальную область, что на самом деле нужно врачам, чтобы решать, кому нужны инъекции, кому — лазерное лечение, а кто может безопасно ждать. В этом исследовании показано, как новый метод искусственного интеллекта (ИИ), основанный на данных, может научиться «видеть» фовеа ближе к тому, как это делает офтальмолог, учитывая всю анатомическую карту глаза, а не только саму фовеа.

Почему трудно очертить фовеа

Фовеа — это крошечное, неглубокое углубление в сетчатке, обеспечивающее резкое центральное зрение и богатое восприятие цвета. На фундус‑снимках её границы нечеткие, внешний вид варьируется в зависимости от камеры, а при заболеваниях фовеа может быть ещё более размыта. Традиционные компьютерные методы опирались на простые правила яркости и геометрии, которые быстро ломаются в присутствии поражений или при плохом качестве изображения. Новые системы глубокого обучения улучшили обнаружение фовеа, но обычно либо обрабатывают каждую структуру глаза отдельно, либо полагаются на всё более сложные архитектуры сетей. Обе стратегии часто игнорируют простую клиническую реальность: офтальмологи не ищут фовеа в изоляции — они используют ориентиры, такие как диск зрительного нерва и рисунок кровеносных сосудов, чтобы вывести, где должна находиться фовеа, даже когда её трудно разглядеть.

Обучение ИИ чтению анатомической карты глаза

Авторы предлагают иную стратегию: вместо изобретения всё более замысловатых архитектур они обогащают метки, используемые для обучения стандартной, эффективной модели. Они создали новый набор данных IDRiD-RETA-FV, в котором специалисты по глазам аккуратно нарисовали пиксельные контуры не только фовеа, но и диска зрительного нерва, сосудов, всей сетчатки и фона. Двое офтальмологов следовали строгому протоколу и достигли почти полного совпадения в разметке, что дало надёжную эталонную основу для системы ИИ. В этот набор данных встроили MNv4Fovea — модель сегментации на основе широко используемой архитектуры, но обучили её сегментировать все анатомические структуры одновременно. Постепенно добавляя больше контекста в обучающие метки — сначала только фовеа против фона, затем с включением диска, потом контура сетчатки и, наконец, сосудов — они могли напрямую измерить, насколько каждая анатомическая часть помогает модели находить фовеа.

Как контекст и умная аугментация повышают точность

Результаты показывают, что контекст имеет огромное значение. Когда модель обучалась только по меткам фовеа и фона, она правильно определяла чуть больше четверти пикселей фовеа. Простое добавление диска принесло лишь скромное улучшение. Но как только был включён контур сетчатки, производительность резко возросла, а добавление кровеносных сосудов подняло полноту обнаружения фовеа выше 90 процентов. Другими словами, когда модели дали ту же «карту», которой пользуются офтальмологи — диск, сосуды и граница сетчатки — она значительно лучше стала очерчивать фовеа. Чтобы система работала с изображениями от разных камер, команда также предложила новый способ варьирования цвета и яркости изображений. Они смоделировали, как выглядят другие публичные наборы глазных снимков, используя статистическое распределение, называемое обобщённым экстремальным распределением (GEV), и преобразовали тренировочные изображения, чтобы имитировать эти стили, сохраняя анатомию. Эта аугментация на основе GEV почти вдвое увеличила долю успешных обнаружений фовеа по сравнению со стандартными геометрическими изменениями.

Доказательства работоспособности на многих наборах данных

MNv4Fovea протестировали как на новом экспертно размеченном наборе, так и на нескольких известных публичных коллекциях ретинальных изображений. На отложенной тестовой части IDRiD-RETA-FV модель показала высокий индекс совпадения между предсказанными и истинными областями фовеа и локализовала центр фовеа с погрешностью всего в несколько пикселей — по сути всегда обнаруживая фовеа, когда она присутствовала. На внешних наборах данных, таких как MESSIDOR, REFUGE, ARIA и MAPLES‑DR, модель сопоставляла или превосходила современные методы по близости предсказаний фовеа к эталонным точкам. Любопытно, что в некоторых случаях числовые метрики выглядели скромно, потому что внешние наборы данных по‑разному определяли «фовеа» — например, маркировали широкую макулярную зону вместо крошечной клинической фовеа — тем не менее экспертная проверка показала, что предсказания модели анатомически корректны и часто ближе к мнению специалиста, чем к исходной разметке.

Что это значит для пациентов и будущих инструментов

Для людей с диабетом исследование указывает путь к более надёжным, широко применимым инструментам скрининга, которые делают больше, чем просто ставят точку на сетчатке. Обучаясь на полном анатомическом контексте — диске, сосудах и контуре сетчатки — вместо того чтобы полагаться только на архитектурные ухищрения, MNv4Fovea может точно картировать область фовеа, что является ключевым шагом при решении, угрожает ли отёк или поражения центральному зрению. Авторы утверждают, что этот дата‑центричный, анатомически направленный подход может дополнить будущие улучшения в дизайне сетей и что аналогичные стратегии могут быть полезны во многих других областях медицинской визуализации, где тонкие структуры нужно находить в сложных, поражённых болезнью ландшафтах.

Цитирование: Chankhachon, S., Kansomkeat, S., Bhurayanontachai, P. et al. Contextual anatomy-guided deep learning for accurate fovea segmentation in diabetic retinopathy fundus images. Sci Rep 16, 10388 (2026). https://doi.org/10.1038/s41598-026-40287-y

Ключевые слова: диабетическая ретинопатия, ретинальная визуализация, сегментация фовеа, глубинное обучение, анализ медицинских изображений