Clear Sky Science · ru

Применение предобученных крупномасштабных визуально-языковых моделей для предварительной диагностики беловатых бляшек в пищеводе при массовом скрининге рака пищевода

· Назад к списку

Почему эти пятна в горле важны

Во время плановых обследований желудка и глотки врачи часто обнаруживают небольшие белые пятна внутри пищевода. Большинство из них безвредно, но некоторые указывают на раннюю стадию рака, которую можно излечить при своевременном обнаружении. В условиях массового скрининга, даже для экспертов, трудно отличить такие похожие по виду образования. В этом исследовании изучают, может ли продвинутая система искусственного интеллекта помочь врачам быстро отфильтровать опасные изменения от безобидных и даже описать увиденное простым языком.

Figure 1
Figure 1.

Распространённые белые пятна с очень разными рисками

Белые бляшки в пищеводе встречаются sorprendente часто: в этой большой программе скрининга более одного из пяти пациентов имел такие изменения. Однако эти бляшки могут возникать по весьма разным причинам. Некоторые представляют собой ранние раковые поражения пищевода, выглядящие как слегка приподнятые, шершавые белые участки, которые нельзя стереть. Другие вызываются грибковой инфекцией: она образует мягкие белые налёты, которые могут отшелушиваться, обнажая сырую ткань. Есть также крошечные доброкачественные выросты — папилломы, и плоские зернистые участки, известные как гликогенная акантозия, которые обычно безвредны и требуют простого наблюдения. Поскольку варианты лечения варьируются от срочной биопсии до простого наблюдения, верное визуальное заключение на этом первом этапе крайне важно.

Преобразование снимков эндоскопа в умные рекомендации

Исследователи создали систему компьютерной поддержки диагностики на базе мощной визуально-языковой модели BLIP, изначально обученной на огромных наборах изображений и текстов. Они загрузили в систему 13 922 эндоскопических изображений более чем от 2 000 пациентов, покрывающих четыре основные причины появления белых бляшек и включая как стандартные изображения при белом свете, так и специальный режим контрастирования — узкополосную визуализацию (NBI). В отличие от прежних инструментов, которые просто присваивали метку заболевания, эта система делает две вещи одновременно: предсказывает, какое из четырёх состояний представлено, и генерирует короткое текстовое описание того, что она «видит» на изображении — например, местоположение и внешний вид бляшек.

Обучение ИИ при ограниченных медицинских данных

Коллекции медицинских изображений малы по сравнению с обычными фотобиблиотеками, и это может ограничивать эффективность ИИ. Чтобы компенсировать это, команда добавила в модель BLIP специальные модули «позитивно‑стимулирующего шума». Проще говоря, эти модули создают мягкие, основанные на данных вариации каждого изображения и внутренних карт признаков модели, подталкивая систему к выучиванию более устойчивых паттернов без перегрузки случайными изменениями. Модель затем дополнительно дообучали так, чтобы её понимание изображений согласовывалось с экспертными диагнозами и текстовыми описаниями, предоставленными опытными эндоскопистами.

Figure 2
Figure 2.

Превосходство над соперничающими моделями и врачами

В тестах новая система превзошла несколько ведущих моделей, работающих только с изображениями, по всем ключевым показателям для всех четырёх заболеваний, используя оба режима эндоскопии. Она также оказалась лучше специализированной медицинской визуально‑языковой модели LLaVA‑Med в задаче генерации точных диагностических ключевых слов в текстовых описаниях. В прямом «соревновании чтения» с четырьмя эндоскопистами — двумя старшими и двумя младшими — ИИ показал более высокую общую точность в классификации изображений. Наиболее впечатляюще, что он превосходил всех врачей в выявлении раннего рака пищевода, особенно по показателю полноты (recall): он пропускал меньше случаев рака при сохранении достойной точности.

Что это может значить для будущих обследований

Исследование показывает, что тщательно адаптированные визуально‑языковые модели ИИ могут стать ценным помощником в масштабных программах скрининга. Такая система могла бы в реальном времени помечать подозрительные белые бляшки, снижая число пропущенных ранних случаев рака, и избавлять многих пациентов от ненужных биопсий, подтверждая врачам, когда поражение выглядит безопасно доброкачественным. Работу ещё предстоит проверить на эндоскопических видео, на более редких типах белых бляшек и в разных больницах, но результаты указывают на будущее, где ИИ не только обнаруживает проблемы на медицинских изображениях, но и объясняет своё заключение на языке, помогающем принимать более быстрые и последовательные клинические решения.

Цитирование: Li, Y., Li, X., Zhang, D. et al. The application of pre-trained large visual-language models for preliminary diagnosis of esophageal whitish plaques in large-scale esophageal cancer screening. npj Precis. Onc. 10, 94 (2026). https://doi.org/10.1038/s41698-026-01301-8

Ключевые слова: скрининг рака пищевода, ИИ для эндоскопии, визуально-языковые модели, компьютерная поддержка диагностики, беловатые бляшки в пищеводе