Clear Sky Science · ru
SwinCup-DiscNet: Рамочная трансформерная модель для диагностики глаукомы с использованием признаков диска и чаши зрительного нерва
Почему это важно для сохранения зрения
Глаукома — одна из ведущих причин необратимой слепоты в мире, при этом она часто развивается незаметно, без боли и явных ранних симптомов. Офтальмологи могут заметить тонкие изменения на задней стенке глаза до того, как пострадает зрение, но проверять каждую фотоснимок вручную долго и порой субъективно. В этой статье представлена SwinCup-DiscNet — новая система искусственного интеллекта (ИИ), которая анализирует фотографии сетчатки для раннего выявления глаукомы, сочетая классические клинические признаки с современными методами глубокого обучения. 
Взгляд на нерв внутри глаза
Чтобы понять, что делает система, полезно знать, как обычно обнаруживают глаукому. Специалисты исследуют диск зрительного нерва — место, где нерв, передающий зрительную информацию, покидает глаз. В центре этого «диска» находится более светлая впадина, называемая «чашей». По мере прогрессирования глаукомы чаша обычно углубляется и расширяется, за счет чего истончается окружающий нервный ободок. Важным показателем является отношение чаши к диску, которое сравнивает размеры чаши и диска. Более высокое значение этого показателя часто указывает на повреждение. Измерять это отношение вручную на тысячах снимков ретины утомительно, и даже эксперты могут расходиться во мнениях. SwinCup-DiscNet автоматизирует и измерение этого соотношения, и общий вывод о вероятности наличия глаукомы.
Двухканальный ИИ, видящий детали и общую картину
Система работает по двум параллельным направлениям при поступлении снимка глазного дна. Во-первых, ветвь сегментации изолирует диск и центральную чашу. Для этого используется специализированная сеть Attention U-Net, которая обучается выделять важные структуры и игнорировать отвлекающие фоновые элементы, такие как кровеносные сосуды и артефакты освещения. После определения границ чаши и диска система сглаживает их и аппроксимирует чистыми овалами, затем измеряет их вертикальные размеры для вычисления вертикального отношения чаши к диску — клинически признанного маркера глаукомы.
Изучение шаблонов, недоступных простым измерениям
Во втором направлении трансформерная ветвь рассматривает всё изображение целиком, не сводя вывод к одному числу. Эта ветвь использует Swin Transformer — современную модель глубокого обучения, которая делит изображение на небольшие патчи и анализирует их взаимосвязи по всей сетчатке. Таким образом модель улавливает тонкие шаблоны текстуры, цвета и структуры вокруг зрительного нерва и близлежащих областей, которые могут быть связаны с глаукомой, но трудно поддаются количественной оценке человеку. Из этой глобальной перспективы модель выдает вероятность того, что снимок принадлежит человеку с глаукомой. 
Слияние проверенных признаков и интуиции ИИ
Ключевая идея SwinCup-DiscNet — комбинация этих двух источников доказательств. Вместо того чтобы полагаться только на отношение чаши к диску или только на вероятность от трансформера, система объединяет их по взвешенному правилу. Отношение чаши к диску нормализуется на основе поведения в учебных данных, затем комбинируется с предсказанной моделью вероятностью глаукомы в единый скор. Если полученный объединенный скор превышает порог, глаз классифицируется как глаукоматозный; в противном случае он помечается как нормальный. Такой подход сохраняет решение привязанным к знакомой клинической метрике, одновременно используя более сложные паттерны, которые может обнаружить ИИ. Система также накладывает аппроксимированные контуры диска и чаши на исходное изображение, давая врачам наглядную информацию о том, какая область повлияла на решение.
Проверка метода на практике
Авторы оценили SwinCup-DiscNet на трех широко используемых публичных наборах изображений сетчатки: LAG, ACRIMA и DRISHTI-GS. Эти коллекции различаются типом камер, качеством снимков и составом пациентов, что делает их строгой проверкой. По всем наборам новая система сопоставима или превосходит традиционные сверточные нейронные сети и методы, которые только сегментируют чашу и диск. Она продемонстрировала очень высокое качество сегментации, малую ошибку в оценке отношения чаши к диску и точности классификации, близкие к 99 процентам или выше, с сильными кривыми производительности, указывающими на редкое смешение здоровых и больных глаз. Анализ ошибок показал, что большинство оставшихся ложных срабатываний приходятся на пограничные случаи, где чаша естественно большая, но не патологическая — компромисс, обычно приемлемый для скрининга.
Что это значит для будущего скрининга зрения
Проще говоря, SwinCup-DiscNet показывает, что ИИ может одновременно «думать как врач», используя установленные маркеры, такие как отношение чаши к диску, и «видеть за пределами очевидного», обучаясь сложным шаблонам на снимках сетчатки. Комбинируя эти сильные стороны, система обеспечивает точный и более интерпретируемый скрининг глаукомы по сравнению со многими существующими подходами. При дальнейшем тестировании на данных реальных больниц и возможном расширении для градации тяжести заболевания такой гибридный ИИ может стать практическим помощником в глазных клиниках, помогая выявлять глаукому раньше и предотвращать предотвратимую слепоту.
Цитирование: Chilukuri, R., Praveen, P., Gatla, R.K. et al. SwinCup-DiscNet: A fusion transformer framework for glaucoma diagnosis using optic disc and cup features. Sci Rep 16, 7920 (2026). https://doi.org/10.1038/s41598-026-39065-7
Ключевые слова: глаукома, ретинальная визуализация, глубокое обучение, зрительный нерв, медицинский скрининг