Clear Sky Science · ru

Точный набор изображений глазного дна для оценки степени катаракты и постановки диагноза

· Назад к списку

Почему важны более точные обследования глаз

Катаракта — ведущая причина слепоты в мире, особенно среди пожилых людей. Тем не менее многие узнают о серьёзной проблеме только тогда, когда зрение уже ухудшилось настолько, что мешает повседневной жизни. В этой статье представлен новый, тщательно размеченный набор фотографий глаз и рамочная модель на базе искусственного интеллекта, рассчитанная на оценку тяжести катаракты и объяснение этой оценки простым языком. Превращая одно изображение глаза в подробный «отчёт» о помутнении хрусталика и качестве зрения, работа нацелена на то, чтобы ранняя и точная оценка катаракты стала доступна далеко за пределами специализированных клиник.

Взгляд на заднюю часть глаза

Вместо того чтобы фотографировать сам помутневший хрусталик, исследователи сосредоточились на изображениях глазного дна — цветных снимках сетчатки, светочувствительного слоя на задней стенке глаза. При помутнении хрусталика эти снимки становятся тусклыми и размытыми, сосуды бледнеют, а ключевые области трудно рассмотреть. Врачи уже используют эти признаки неформально, но до настоящего момента не существовало публичного набора данных, связывающего тонкие изменения на таких изображениях с подробными оценками степени катаракты и экспертными письменными объяснениями. Новый набор Cataract Severity and Diagnostic Image (CSDI) заполняет этот пробел, предоставляя ИИ-моделям богатое руководство, необходимое для имитации экспертной оценки.

Figure 1
Figure 1.

Создание детально размеченной коллекции изображений глаз

CSDI основан на 187 изображениях глазного дна пациентов, наблюдавшихся в крупной офтальмологической больнице в Пекине в 2023–2024 годах. Все снимки были сделаны одной и той же камерой и с одинаковыми настройками, чтобы минимизировать технические различия. Двое старших офтальмологов сначала отобрали изображения, исключив плохо экспонированные кадры, частично закрытые или затронутые другими глазными заболеваниями. Для каждого оставшегося снимка они оценивали общую цветовую палитру и четкость, насколько отчётливо виден диск зрительного нерва и его поверхностные сосуды, насколько легко определяется центральная макула и сколько ветвей сосудов сетчатки остаются видимыми. Эти наблюдения были затем сведены как в числовую оценку, так и в структурированное письменное заключение.

От простых меток к детальной «таблице результатов» по катаракте

Вместо того чтобы ограничиться двоичным ответом о наличии катаракты, команда разработала шкалу тяжести от 0 до 10 с точностью до одного знака после запятой. Значения, близкие к нулю, указывают на отсутствие влияния катаракты на изображение глазного дна; значения средней величины соответствуют лёгкому или умеренному размытию, требующему возможного наблюдения; высокие оценки сигнализируют о серьёзном ухудшении качества изображения, совместимом с заметным снижением зрения и вероятной необходимостью операции. Для обеспечения согласованности обучения ИИ исследователи также предоставили автоматические контуры основной области глазного дна и ручные контуры с флагами видимости для диска зрительного нерва. Каждое изображение сопровождается соответствующими диагностическими предложениями на английском и китайском языках, которые в фиксированном порядке описывают смещения цвета, размытие и утрату деталей, давая моделям шаблон того, как эксперты рассуждают о наблюдаемом.

Figure 2
Figure 2.

Обучение мультимодальных ИИ вести себя как офтальмолог

На основе этого набора данных авторы протестировали новую диагностическую схему, основанную на мультимодальных больших языковых моделях — системах, работающих с изображениями и текстом. Эти модели получают снимок глазного дна и короткую инструкцию «действовать как офтальмолог», после чего выдают оценку тяжести и развернутое объяснение. Команда оценивала коммерческие и открытые модели по двум задачам: отнесению каждого случая к одной из пяти степеней тяжести (от нормы до тяжёлой) и генерации диагностического описания, совпадающего по формулировкам с экспертными. Затем они дообучили несколько открытых моделей с помощью эффективных техник, чтобы те могли работать в пределах больничных сетей, сохраняя данные пациентов на месте и при этом достигать или даже превосходить результаты крупных коммерческих систем.

Что это значит для пациентов и врачей

Для широкой аудитории ключевой посыл таков: теперь одно фото глаза можно превратить в нюансированное представление влияния катаракты, а не в грубое «есть или нет». Набор данных CSDI, доступный бесплатно вместе с кодом, позволяет исследователям и клиницистам по всему миру создавать и сравнивать ИИ‑системы, говорящие на одном языке с офтальмологами. В долгосрочной перспективе такие инструменты могут поддерживать дистанционный скрининг в сообществах с нехваткой офтальмологов, снижать расхождения во мнениях между клиницистами и помогать пациентам понять, почему операция рекомендована или не рекомендована — давая более ясное представление о болезни, чьим характерным признаком, иронично, является потеря ясности.

Цитирование: Xie, Z., Ao, M., Tang, H. et al. A fine-grained fundus image dataset for cataract severity assessment and diagnosis. Sci Data 13, 418 (2026). https://doi.org/10.1038/s41597-026-06684-8

Ключевые слова: катаракта, изображение глазного дна, медицинский ИИ, модели «зрение‑язык», набор данных по офтальмологии