Clear Sky Science · ru

Модель генерации подписей ИИ для цифровой патологии аденокарциномы в эндоскопической гистопатологии с использованием механизмов внимания множественных образцов

2026-03-12 · Назад к списку

Почему важно превращать слайды в слова

Когда врачи подозревают рак желудка, из слизистой делают маленькие образцы ткани и изучают их под микроскопом. Интерпретация этих слайдов — высококвалифицированная и трудоёмкая работа патологов, а письменный отчёт, который они составляют, направляет все последующие решения о лечении. В этом исследовании представлена система искусственного интеллекта (ИИ), которая делает нечто удивительно человеческое: она просматривает цифровые изображения гастрических биопсий и автоматически пишет короткие, структурированные описания, похожие на отчёт патолога.

От стеклянного слайда к цифровому помощнику

Аденокарцинома желудка, распространённая и опасная форма рака желудка, в настоящее время диагностируется и градуируется патологами, которые визуально изучают образцы биопсий. За последнее десятилетие во многих больницах начали сканировать стеклянные слайды в очень большие цифровые изображения, что открыло путь для инструментов ИИ, способных помогать в диагностике. Ранние системы в основном решали двоичные вопросы, например, присутствует ли рак, или присваивали категорию. Однако реальные патологические отчёты являются повествовательными: они описывают форму клеток, тканевые паттерны и степень агрессивности опухоли. Лишь немногие исследования пытались генерировать такие описательные подписи прямо из целых слайдов, и многие из них зависят от дополнительных меток, указывающих заранее определённые подтипы — это дорого и не всегда доступно.

Новый способ, чтобы ИИ читал множество маленьких фрагментов

Авторы представляют модель для генерации подписей под названием MIAC (Multi‑instance Attention Captioning), разработанную специально для биопсийных слайдов аденокарциномы желудка. Один цифровой слайд слишком велик, чтобы подать его в модель целиком, поэтому его делят на множество маленьких квадратных изображений, или патчей. MIAC использует подход, известный как обучение по множественным экземплярам: вместо того чтобы рассматривать патчи как упорядоченную последовательность, модель рассматривает их как множество, позволяя количеству и расположению патчей варьироваться от слайда к слайду, как это происходит в рутинной практике. Мощная изображенческая сеть сначала извлекает визуальные признаки из каждого патча. Затем механизм самовнимания, построенный без позиционной информации, обучается тому, насколько сильно каждый патч должен влиять на итоговое резюме. Модель объединяет эти сигналы в одно компактное представление всего слайда, которое затем подаётся в языковой модуль, генерирующий диагностическую подпись длиной в предложение, по одному слову за раз.

Обучение на реальных отчётах, тестирование в другой больнице

Для обучения MIAC исследователи использовали публичный набор данных PatchGastricADC22, содержащий почти тысячу отсканированных биопсийных слайдов из японской больницы. Каждый слайд снабжён коротким диагностическим предложением, взятым из оригинального патологоанатомического отчёта и приведённым к стандартизованной терминологии. Слайды были разбиты на сотни патчей, и модель обучали воспроизводить исходную подпись, получая на вход подмножество этих патчей. Эффективность оценивали с помощью стандартных метрик сравнения текста, которые измеряют, насколько сгенерированные ИИ описания совпадают с экспертным текстом. MIAC превзошла предыдущий метод, являвшийся передовым, по всем метрикам, особенно когда ей позволяли видеть больше патчей на слайд во время обучения, что указывает на лучшее улавливание картины слайда из разрозненных локальных видов.

Учёт различий между больницами

Ключевой вопрос для любой медицинской системы ИИ — работает ли она, когда данные приходят из нового места. Поэтому команда протестировала MIAC на независимом наборе биопсийных слайдов желудка, собранных в другой больнице, с подписями, написанными другим патологом. Эти изображения отличались по цвету из‑за местных нюансов окрашивания и сканирования — распространённая проблема, которая может сбивать модели, работающие с изображениями. Исследователи применили широко используемую технику нормализации цвета, которая корректирует оттенки окрашивания, чтобы они ближе соответствовали тренировочным слайдам. Даже без дополнительной тонкой подстройки MIAC генерировала клинически значимые подписи на этом внешнем наборе данных, и её производительность улучшалась при применении нормализации цвета и при увеличении числа выбранных патчей с каждого слайда.

Что это может значить для ухода за пациентами

MIAC не предназначена для замены патологов; она, скорее, призвана составлять чёткие стандартизованные описания, которые эксперты могут быстро просмотреть и отредактировать. В загруженных клиниках или регионах с ограниченным доступом к специалистам такой инструмент мог бы сократить время составления отчётов, уменьшить вариативность формулировок и помечать случаи со сложными паттернами для более пристального рассмотрения. В исследовании также подчёркнуты текущие ограничения: производительность всё ещё снижается, когда модель сталкивается со слайдами из новых учреждений или с необычными тканевыми образцами, а автоматические языковые метрики не полностью отражают клиническую полезность. Авторы утверждают, что для безопасного внедрения таких систем в повседневные диагностические рабочие процессы потребуются более богатые многопрофильные наборы данных, более умные способы выбора патчей для анализа и прямые отзывы от патологов.

Цитирование: Lee, Y., Bai, K., Kim, Y. et al. AI caption generation model for digital pathology of adenocarcinoma in endoscopic histopathology using multi-instance attention mechanisms. Sci Rep 16, 13244 (2026). https://doi.org/10.1038/s41598-026-37455-5

Ключевые слова: рак желудка, цифровая патология, медицинский ИИ, генерация подписей к изображениям, гистопатология