Clear Sky Science · ru
Модель vision transformer для выявления глаукомы по фотографиям глазного диска
Почему это важно для повседневного зрения
Глаукома — одна из ведущих причин необратимой слепоты в мире, при этом нередко протекает бессимптомно, пока зрение уже серьёзно не повреждено. Хорошая новость в том, что простые фотографии задней части глаза широко доступны, даже в клиниках с ограниченным оборудованием. В этом исследовании проверяют, может ли продвинутая компьютерная программа смотреть такие снимки и надёжно отмечать ранние признаки глаукомы задолго до того, как большинство людей заметят проблемы.
Тихая угроза для зрения
Глаукома медленно повреждает зрительный нерв — пучок волокон, передающих зрительные сигналы от глаза к мозгу. Врачи ищут изменения в глазном диске, точке выхода нерва из глаза, но интерпретировать эти тонкие формы сложно, и даже специалисты часто не сходятся во мнениях. Во многих регионах мира также не хватает офтальмологов для массового скрининга. В результате, как полагают, около половины случаев глаукомы в мире остаются не диагностированными, особенно в странах с низким и средним уровнем дохода, и многие узнают о болезни лишь после значительной потери зрения.
Обучение компьютера «читать» фото глаз
Исследователи собрали более тысячи фотографий глазного диска от пациентов с ранней глаукомой, лечившихся в одном американском глазном центре, а также сотни снимков здоровых глаз из двух публичных баз изображений. Специалисты по глаукоме оценивали каждое изображение как глаукоматозное или здоровое, опираясь только на внешний вид зрительного нерва и исключая глаза с другими сетчаточными патологиями. Команда кадрировала каждое изображение так, чтобы глазной диск занимал сопоставимую часть кадра, и использовала тщательные проверки качества и реалистичные преобразования изображений — небольшие повороты, увеличение, размытие — чтобы расширить обучающую выборку, сохранив её приближённой к реальным условиям. 
Новый тип нейросети
Вместо классических систем анализа изображений команда построила модель на «vision transformer» — новом семействе инструментов глубокого обучения, изначально разработанных для распознавания объектов на бытовых фотографиях. Модель делит каждое изображение глазного диска на множество мелких фрагментов, представляет каждый фрагмент как токен данных и затем использует слои attention-блоков, чтобы оценить, как разные области диска соотносятся между собой. Сеть выдаёт оценку от 0 до 1, отражающую вероятность наличия глаукомы; значения ≥0.5 считаются положительными. Чтобы максимально использовать доступные данные, исследователи применяли сбалансированную выборку, взвешенные функции потерь и перекрёстную проверку, а также сравнивали трансформер с сильной сверточной сетью EfficientNet. 
Насколько хорошо система выявляла раннюю болезнь
При тестировании на ранее невидимых изображениях модель vision transformer почти идеально разделяла глаукоматозные и здоровые глаза. Основная метрика — площадь под кривой приёмник-оператор (AUC) — на тестовой выборке составила 1.00, точность — около 99 процентов, с очень высокой чувствительностью и специфичностью. На практике система почти не пропускала случаи глаукомы и лишь немногим здоровым глазам присваивала метку «болезнь». Когда исследователи позже подвергли модель испытанию на почти тысяче глаз с умеренной и выраженной глаукомой, она правильно идентифицировала все, кроме одного случая. Трансформер также превзошёл подход на базе EfficientNet, у которого была ниже точность и больше ложных срабатываний и пропусков.
Что это может значить для офтальмологической помощи
Поскольку модель работает со стандартными фотографиями глазного диска и обучалась на расово разнородной группе пациентов, она даёт реалистичное представление о том, как искусственный интеллект может помочь в скрининге глаукомы во многих частях мира. Авторы отмечают, что их исследование использует относительно меньшую общую выборку по сравнению с некоторыми другими работами и опирается на внешние базы данных для многих здоровых контрольных изображений, что может ввести скрытые искажения. Они утверждают, что важны следующие шаги: расширение и разнообразие коллекций изображений, съёмка портативными камерами и включение базовой информации о пациенте, такой как возраст или степень близорукости. Тем не менее результаты указывают, что интеллектуальный анализ простых фотографий глаз может стать экономичным способом раннего обнаружения глаукомы и сокращения предотвратимой слепоты, особенно там, где мало специалистов.
Главная мысль для читателей
Эта работа показывает, что продвинутая компьютерная модель может научиться распознавать ранние признаки глаукомы по рутинным фотографиям зрительного нерва с очень высокой точностью. Хотя необходимы дополнительные испытания в клинических условиях, такие инструменты в будущем могут помочь врачам быстро сортировать большое число пациентов на тех, кому нужна срочная помощь, и тех, кому она пока не требуется, делая раннюю защиту зрения более доступной по всему миру.
Цитирование: Bouris, E., Leyva, B.K., Odugbo, O.P. et al. A vision transformer model for the detection of glaucoma from optic disc photographs. Sci Rep 16, 14831 (2026). https://doi.org/10.1038/s41598-026-44662-7
Ключевые слова: скрининг глаукомы, фотография глазного диска, глубокое обучение, vision transformer, здоровье глаз