Clear Sky Science · ru

Модель vision transformer для выявления глаукомы по фотографиям глазного диска

2026-03-24 · Назад к списку

Почему это важно для повседневного зрения

Глаукома — одна из ведущих причин необратимой слепоты в мире, при этом нередко протекает бессимптомно, пока зрение уже серьёзно не повреждено. Хорошая новость в том, что простые фотографии задней части глаза широко доступны, даже в клиниках с ограниченным оборудованием. В этом исследовании проверяют, может ли продвинутая компьютерная программа смотреть такие снимки и надёжно отмечать ранние признаки глаукомы задолго до того, как большинство людей заметят проблемы.

Тихая угроза для зрения

Глаукома медленно повреждает зрительный нерв — пучок волокон, передающих зрительные сигналы от глаза к мозгу. Врачи ищут изменения в глазном диске, точке выхода нерва из глаза, но интерпретировать эти тонкие формы сложно, и даже специалисты часто не сходятся во мнениях. Во многих регионах мира также не хватает офтальмологов для массового скрининга. В результате, как полагают, около половины случаев глаукомы в мире остаются не диагностированными, особенно в странах с низким и средним уровнем дохода, и многие узнают о болезни лишь после значительной потери зрения.

Обучение компьютера «читать» фото глаз

Исследователи собрали более тысячи фотографий глазного диска от пациентов с ранней глаукомой, лечившихся в одном американском глазном центре, а также сотни снимков здоровых глаз из двух публичных баз изображений. Специалисты по глаукоме оценивали каждое изображение как глаукоматозное или здоровое, опираясь только на внешний вид зрительного нерва и исключая глаза с другими сетчаточными патологиями. Команда кадрировала каждое изображение так, чтобы глазной диск занимал сопоставимую часть кадра, и использовала тщательные проверки качества и реалистичные преобразования изображений — небольшие повороты, увеличение, размытие — чтобы расширить обучающую выборку, сохранив её приближённой к реальным условиям.

Figure 1. Система ИИ оценивает простые фотографии глаз, чтобы одним взглядом отличить здоровые зрительные нервы от поражённых глаукомой.

Новый тип нейросети

Вместо классических систем анализа изображений команда построила модель на «vision transformer» — новом семействе инструментов глубокого обучения, изначально разработанных для распознавания объектов на бытовых фотографиях. Модель делит каждое изображение глазного диска на множество мелких фрагментов, представляет каждый фрагмент как токен данных и затем использует слои attention-блоков, чтобы оценить, как разные области диска соотносятся между собой. Сеть выдаёт оценку от 0 до 1, отражающую вероятность наличия глаукомы; значения ≥0.5 считаются положительными. Чтобы максимально использовать доступные данные, исследователи применяли сбалансированную выборку, взвешенные функции потерь и перекрёстную проверку, а также сравнивали трансформер с сильной сверточной сетью EfficientNet.

Figure 2. Фотография глаза разбивается на фрагменты, которые проходят через многослойную обработку, разделяя здоровые и повреждённые диски зрительного нерва.

Насколько хорошо система выявляла раннюю болезнь

При тестировании на ранее невидимых изображениях модель vision transformer почти идеально разделяла глаукоматозные и здоровые глаза. Основная метрика — площадь под кривой приёмник-оператор (AUC) — на тестовой выборке составила 1.00, точность — около 99 процентов, с очень высокой чувствительностью и специфичностью. На практике система почти не пропускала случаи глаукомы и лишь немногим здоровым глазам присваивала метку «болезнь». Когда исследователи позже подвергли модель испытанию на почти тысяче глаз с умеренной и выраженной глаукомой, она правильно идентифицировала все, кроме одного случая. Трансформер также превзошёл подход на базе EfficientNet, у которого была ниже точность и больше ложных срабатываний и пропусков.

Что это может значить для офтальмологической помощи

Поскольку модель работает со стандартными фотографиями глазного диска и обучалась на расово разнородной группе пациентов, она даёт реалистичное представление о том, как искусственный интеллект может помочь в скрининге глаукомы во многих частях мира. Авторы отмечают, что их исследование использует относительно меньшую общую выборку по сравнению с некоторыми другими работами и опирается на внешние базы данных для многих здоровых контрольных изображений, что может ввести скрытые искажения. Они утверждают, что важны следующие шаги: расширение и разнообразие коллекций изображений, съёмка портативными камерами и включение базовой информации о пациенте, такой как возраст или степень близорукости. Тем не менее результаты указывают, что интеллектуальный анализ простых фотографий глаз может стать экономичным способом раннего обнаружения глаукомы и сокращения предотвратимой слепоты, особенно там, где мало специалистов.

Главная мысль для читателей

Эта работа показывает, что продвинутая компьютерная модель может научиться распознавать ранние признаки глаукомы по рутинным фотографиям зрительного нерва с очень высокой точностью. Хотя необходимы дополнительные испытания в клинических условиях, такие инструменты в будущем могут помочь врачам быстро сортировать большое число пациентов на тех, кому нужна срочная помощь, и тех, кому она пока не требуется, делая раннюю защиту зрения более доступной по всему миру.

Цитирование: Bouris, E., Leyva, B.K., Odugbo, O.P. et al. A vision transformer model for the detection of glaucoma from optic disc photographs. Sci Rep 16, 14831 (2026). https://doi.org/10.1038/s41598-026-44662-7

Ключевые слова: скрининг глаукомы, фотография глазного диска, глубокое обучение, vision transformer, здоровье глаз