Clear Sky Science · ru

RDE-DR: надежные глубокие ансамблевые CNN для автоматического обнаружения диабетической ретинопатии на фундус‑снимках

· Назад к списку

Почему сканирование глаз важно для людей с диабетом

Диабетическая ретинопатия — осложнение диабета, которое постепенно повреждает светочувствительную ткань на задней стенке глаза. При раннем обнаружении её часто можно лечить до потери зрения. Однако ручная проверка тысяч снимков сетчатки отнимает много времени у специалистов. В этом исследовании рассматривается, как тщательно продуманная комбинация моделей искусственного интеллекта может помочь более надёжно отбирать такие изображения, чтобы люди с риском выявлялись раньше, а здоровые пациенты избегали ненужных повторных визитов.

Figure 1. Как объединённые модели ИИ проверяют фотографии глаз, чтобы надёжнее отмечать признаки диабетического поражения.
Figure 1. Как объединённые модели ИИ проверяют фотографии глаз, чтобы надёжнее отмечать признаки диабетического поражения.

Поиск признаков тревоги на фотографиях глаза

Исследователи сосредотачиваются на цветных снимках сетчатки, известных как фундус‑изображения, из публичного набора данных APTOS 2019. Эти кадры показывают микрососуды и участки кровоизлияний или утечек, которые указывают на диабетическое поражение. Команда сводит исходные пять медицинских степеней в более простую задачу, важную для массового скрининга: есть ли на этом снимке диабетическая ретинопатия или нет. Это превращает задачу в бинарный «да/нет», который автоматическая система может быстро решать для тысяч пациентов.

Как сделать скрытые детали легче распознаваемыми для компьютеров

Реальные снимки глаз сильно различаются по резкости, яркости и цвету, что может вводить модели в заблуждение. Чтобы снизить эту проблему, авторы используют метод повышения контраста CLAHE, который усиливает локальные детали без чрезмерного усиления шума. Они приводят все изображения к стандартному квадратному размеру, нормализуют цвета и применяют случайные повороты и зеркальные отражения в ходе обучения, чтобы система не переобучалась на один угол съёмки или условия освещения. Набор данных делят так, что четыре пятых изображений обучают модели, а одна пятая откладывается для проверки обобщающей способности на новых случаях.

Несколько «глаз» вместо одного

Вместо опоры на единственную модель глубокого обучения исследование обучает четыре популярных свёрточных нейронных сети, первоначально разработанные на большой коллекции повседневных фотографий. Эти модели, известные в сообществе как VGG16, VGG19, ResNet50 и DenseNet121, дообучаются для распознавания здоровой и поражённой сетчатки. Каждая из них уже хорошо работает сама по себе, корректно классифицируя примерно 98 процентов тестовых изображений и пропуская лишь несколько поражённых случаев. Ключевая идея работы — объединить их сильные стороны через несколько схем слияния решений, включая простое голосование, усреднение уверенности и более продвинутые правила, вдохновлённые нечёткой логикой.

Figure 2. Как улучшенные снимки проходят через несколько AI‑сетей, чьи объединённые сигналы решают: болезнь или здоровье.
Figure 2. Как улучшенные снимки проходят через несколько AI‑сетей, чьи объединённые сигналы решают: болезнь или здоровье.

Осторожное объединение мнений моделей

Команда систематически изучает семь способов смешивания выходов четырёх моделей, всегда придерживаясь одной и той же схемы обучения. Они также тонко настраивают порог, при котором вероятность преобразуется в предсказание «да» или «нет», вместо предположения фиксированной середины. Просматривая множество порогов, они измеряют, как точность, чувствительность и точность положительных предсказаний вступают в компромиссы — это важно для инструментов скрининга, которые должны избегать как пропуска болезни, так и излишних ложных тревог. Дальше они смотрят за пределы простой точности, оценивая, насколько уверенно модели разделяют здоровые и поражённые снимки с помощью кривых ошибок и графиков плотности вероятностей.

Что результаты означают для будущего скрининга глаз

В целом ансамблевые методы сохраняют или слегка улучшают уже высокие результаты отдельных моделей, достигая примерно 98,6 процента точности и очень высокой способности отделять классы. Простые схемы, такие как большинство голосов или усреднение значений уверенности, оказываются удивительно стабильными, тогда как одна из нечётких методик более чувствительна к деталям дизайна и показывает менее сбалансированные результаты. Для неспециалиста главный вывод таков: объединение нескольких хорошо обученных «читалок» изображений, после тщательной предобработки снимков и настройки способа объединения их голосов, даёт более надёжного автоматизированного помощника. Такой инструмент не заменит офтальмологов, но может помочь им быстро рассортировать большое количество фундус‑фотографий, сосредоточив ограниченное время клиники на пациентах, у которых на снимках есть ранние признаки проблем.

Цитирование: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Ключевые слова: диабетическая ретинопатия, фундус‑изображение, глубокое обучение, ансамблевые модели, медицинский скрининг