Clear Sky Science · ru

Понимание влияния данных предобучения на ретинальные фундаментальные модели на примере двух больших когортых фундусов

· Назад к списку

Почему важны снимки глаз и данные для обучения ИИ

Снимки глаза всё чаще используются не только для выявления заболеваний глаз, но и для получения подсказок о состоянии общего здоровья — от диабета до риска инсульта. Мощные системы искусственного интеллекта, называемые фундаментальными моделями, могут обучаться на миллионах таких изображений и затем адаптироваться к множеству медицинских задач. В этом исследовании поставлен простой, но важный вопрос: меняет ли тип данных, на которых мы обучаем эти модели — кто пациенты, откуда они и как выглядят их снимки — их точность и справедливость?

Figure 1
Figure 1.

Две огромные коллекции снимков глаз на разных континентах

Исследователи построили своё исследование вокруг двух очень больших наборов фотографий сетчатки, каждый из которых содержал примерно по 900 000 изображений. Один набор поступил из Moorfields Eye Hospital в Великобритании — специализированной больницы, где пациенты, как правило, старше и имеют больше заболеваний глаз. Другой — из Китайской программы профилактики диабета в Шанхае, ориентированной на скрининг в сообществе с более молодыми и в основном здоровыми взрослыми. Помимо возраста и состояния здоровья, группы отличались по половому составу, этническому составу и камерам, использованным для съёмки. Команда тщательно измерила эти различия, используя базовые демографические данные — возраст и пол, вычисленные компьютером признаки изображений и клинически значимые показатели сосудов и зрительного нерва на заднем плане глаза.

Обучение «близнецов» ИИ-моделей для проверки общей производительности

Используя идентичные процедуры обучения, группа создала две «близнецовые» ретинальные фундаментальные модели: одну, обученную только на изображениях из британской больницы, и другую, обученную только на китайских скрининговых данных. Обе модели учились в самонаправленном режиме на неразмеченных снимках, а затем адаптировались к конкретным задачам, таким как обнаружение диабетической патологии глаза и предсказание риска инсульта. Ключевой тест заключался в том, сможет ли модель, обученная в одном окружении, хорошо работать на данных из другого окружения или на публичных наборах, собранных в нескольких других странах. По большинству задач и наборов данных две модели показали похожие результаты, даже при оценке на изображениях, довольно отличающихся от тех, что они видели ранее. Это говорит о том, что ретинальные фундаментальные модели, обученные на достаточно большом объёме данных, могут хорошо обобщать знание между больницами, странами и типами камер.

Figure 2
Figure 2.

Где появляются проблемы со справедливостью: возраст против пола и этничности

Хорошая средняя точность недостаточна, если система работает лучше для одних людей, чем для других. Чтобы исследовать справедливость, авторы сравнили, как две модели проявляют себя в разных возрастных, половых и этнических подгруппах, используя тщательно подобранный тестовый набор. Оказалось, что возраст имеет наибольшее значение. Модель, обученная на данных из Великобритании, где пациенты были старше, как правило, показывала лучшие результаты в старших возрастных группах, тогда как модель, обученная на китайских данных с более молодыми взрослыми, работала лучше на молодых людях. Эти разрывы проявлялись последовательно по нескольким задачам, связанным с заболеваниями глаза. Напротив, различия в производительности между мужчинами и женщинами или между основными этническими группами были меньшими и менее последовательными и не коррелировали просто с тем, насколько эти группы были представлены в обучающих данных.

Как сам глаз меняется с возрастом

Чтобы понять, почему возраст оказывал столь сильное влияние, команда изучила, как изменяется внешний вид сетчатки с возрастом в обучающих наборах. Они исследовали как клинические показатели — например, насколько сложны и ветвисты сосуды, — так и абстрактные признаки, которые сами извлекают модели ИИ из изображений. Возрастные группы показали чёткие и статистически значимые различия в обоих типах показателей, даже после учёта пола и этничности. Иными словами, структура сетчатки действительно меняется с возрастом так, что модели могут это обнаружить. Из-за этого модель, сильно обученная на одном возрастном диапазоне, может быть более тонко настроена на эту группу, что приводит к тонким, но важным разрывам в справедливости.

Использование синтетических изображений для выравнивания условий

Чтобы проверить, можно ли уменьшить возрастные разрывы, исследователи сгенерировали сотни тысяч синтетических изображений сетчатки, спроектированных так, чтобы напоминать снимки более молодых пациентов. Они смешали эти изображения с реальными больничными снимками, чтобы создать более сбалансированный по возрасту обучающий набор, и затем обучили новую модель. Общая производительность осталась сопоставимой, но точность на молодых людях улучшилась по ряду задач, сократив несправедливость между возрастными группами. Этот эксперимент показывает, что аккуратное добавление синтетических данных может помочь устранить слепые зоны в медицинском ИИ без необходимости собирать существенно больше реальных изображений.

Что это означает для будущего медицинского ИИ

Исследование показывает, что «рацион» данных, которым кормят медицинские ИИ-системы, сильно формирует не только их мощность, но и то, кто получает от них наибольшую выгоду. Ретинальные фундаментальные модели могут работать надёжно между странами и устройствами, что обнадёживает для глобального применения. В то же время работа выявляет, что некоторые характеристики данных — в данном случае возраст — оказывают большее влияние на справедливость, чем другие. Для пациентов и клиницистов вывод таков: прозрачность относительно обучающих данных и целенаправленное балансирование ключевых характеристик необходимы, если мы хотим, чтобы инструменты ИИ служили людям всех возрастов справедливо.

Цитирование: Zhou, Y., Wang, Z., Wu, Y. et al. Understanding pre-training data effects in retinal foundation models using two large fundus cohorts. Nat Commun 17, 3309 (2026). https://doi.org/10.1038/s41467-026-70077-z

Ключевые слова: ретинальная визуализация, справедливость медицинского ИИ, фундаментальные модели, данные предобучения, диабетическая ретинопатия