Clear Sky Science · ru

Мультиклассовая классификация заболеваний глаз с помощью методов слияния EfficientNetB0 на основе глубокого обучения

· Назад к списку

Почему важны ранние проверки зрения

Потеря зрения часто наступает незаметно. Распространённые проблемы глаз — такие как катаракта, глаукома и диабетическое повреждение сетчатки — могут лишать зрения задолго до появления явных симптомов. Во всём мире специалистов по глазам недостаточно, чтобы обследовать всех вовремя, особенно в сельских или малообеспеченных районах. В этом исследовании рассматривается, как интеллектуальная компьютерная система, анализирующая снимки задней части глаза, могла бы помочь врачам раннее и надёжное обнаружение нескольких основных заболеваний глаза, используя тот же тип искусственного интеллекта, что применяется в современных системах поиска по изображениям и распознавании лиц.

Выявление болезни по одному снимку

Офтальмологи уже используют цветные фотоснимки сетчатки — светочувствительного слоя на задней стенке глаза — для поиска заболеваний. На этих изображениях катаракта проявляется как помутнение оптического пути, глаукома изменяет форму зрительного нерва, а диабетическая ретинопатия покрывает сетчатку мелкими утечками и рубцами. Исследователи собрали 4217 высокоразрешающих снимков сетчатки, аккуратно сбалансированных по четырём группам: здоровые глаза, катаракта, глаукома и диабетическая ретинопатия. Работа с сбалансированной коллекцией, собранной из нескольких общедоступных источников, снизила риск того, что компьютер выучит «короткие пути», связанные с одним госпиталем, камерой или типом данных, вместо реальных признаков болезни.

Figure 1
Figure 1.

Два «мозга», работающие вместе

Современные программы для чтения изображений, называемые моделями глубокого обучения, прекрасно справляются с выявлением паттернов, но каждая из них имеет свои сильные и слабые стороны. Вместо того чтобы полагаться на одну модель, команда создала «двухстержневые» системы, которые запускают два известных сетевых алгоритма параллельно и затем объединяют их выводы. Одной из этих сетей был EfficientNetB0 — компактная, эффективная модель, улавливающая общую структуру изображений; она всегда использовалась в качестве базы. Её поочерёдно сочетали с тремя другими моделями — ResNet50, InceptionV3 и AlexNet — которые специализируются на более глубоких, многоуровневых или лёгких схемах распознавания. Системы затем объединяли два набора признаков несколькими способами: простым конкатенированием, сложением, взвешиванием или путем голосования каждой модели за итоговый ответ.

Проверка системы

Исследователи обучили и настроили 12 различных сочетаний моделей на большей части своих снимков сетчатки, оставив часть изображений для проверки производительности. На этом внутреннем тесте лучший подход объединял признаки из EfficientNetB0 и ResNet50, достигая примерно 95% общей точности и почти идеального результата по стандартной метрике качества диагностики. Похожие комбинации с InceptionV3 и AlexNet также показали высокую эффективность. Чтобы проверить, справится ли система с реальным разнообразием, а не просто запомнит обучающую выборку, команда протестировала все модели на 400 изображениях из двух независимых коллекций, сделанных в разных больницах на разных камерах. Здесь точность выросла ещё больше — примерно до 95–98%, и все модели сохранили очень высокие показатели по способности разделять больные и здоровые глаза.

Заглянуть внутрь «чёрного ящика»

Врачи и регуляторы всё чаще задают вопросы не только «Насколько это точно?», но и «Почему система принимает такие решения?». Для ответа авторы использовали инструменты визуализации, такие как Score‑CAM и LIME. Эти инструменты выделяют участки изображения, которые сильнее всего влияют на вердикт модели, превращая «внимание» системы в тепловые карты, наложенные на изображение сетчатки. Для диабетической ретинопатии выделенные зоны совпадали с районами утечки сосудов и пятнами рядом с макулой — центром острого зрения. Для глаукомы фокус был направлен на головку зрительного нерва и окружающие ткани, где происходит повреждение. Решения, связанные с катарактой, подчеркивали диффузное помутнение вдоль визуального пути. Важно, что у нормальных глаз не наблюдалось сильных и неправомерных «горячих» зон. Это тесное соответствие между фокусом модели и анатомией из учебников указывает на то, что система ориентируется на те же признаки, что и клиницисты на практике.

Figure 2
Figure 2.

Что это может значить для повседневной помощи

Для неспециалиста главный вывод в том, что один снимок сетчатки, сделанный стандартной камерой, вскоре может помочь одновременно скринировать несколько основных причин слепоты. Двухсеточная конструкция и умные методы слияния их выводов дали не только высокую точность, но и стабильные результаты, когда изображения поступали из новых клиник и устройств — что необходимо для практического использования. Хотя требуется больше испытаний на больших и более разнообразных популяциях, особенно прежде чем технология сможет самостоятельно направлять лечение, эта работа показывает, что сочетание разных типов искусственных «глаз» может дать быстрые и надежные вторые мнения. В загруженных больницах, небольших клиниках или мобильных скрининговых пунктах такие инструменты могли бы помочь отфильтровать людей, которым срочно нужно обратиться к офтальмологу, потенциально сохранив зрение миллионам.

Цитирование: Sah, U.K., Chatterjee, J.M. & Sujatha, R. Multi-class eye disease classification using deep learning EfficientNetB0 fusion techniques. Sci Rep 16, 6368 (2026). https://doi.org/10.1038/s41598-026-35357-0

Ключевые слова: заболевание глаза, ретинальная визуализация, глубокое обучение, глаукома, диабетическая ретинопатия