Clear Sky Science · ru

Многоплановый vision-transformer для классификации кровоизлияний с использованием аксиальных и сагиттальных данных МРТ

2026-03-18 · Назад к списку

Почему это исследование важно для пациентов и врачей

Когда у человека возможен инсульт или кровоизлияние в мозг, каждая минута на счету. Мозговые сканирования могут выявить опасные кровоизлияния, но быстро и точно интерпретировать эти изображения нелегко, особенно для магнитно-резонансной томографии (МРТ), которая даёт множество видов снимков под разными углами. В этом исследовании предложен новый метод искусственного интеллекта (ИИ), разработанный для чтения многоплановых МРТ более похожим на опытного радиолога способом, с целью более надежного обнаружения кровоизлияний в реальных условиях больниц.

Проблема поиска кровоизлияний на МРТ

Внутричерепное кровоизлияние — кровотечение внутри черепной коробки — представляет собой жизнеугрожающее состояние, требующее быстрой диагностики. В течение десятилетий компьютерная томография (КТ) оставалась основным инструментом при подозрении на кровоизлияние, потому что она быстрая и относительно проста в интерпретации. МРТ может сопоставляться с КТ или превосходить её в обнаружении кровоизлияний, а также лучше показывает давность кровотечения и выявляет другие проблемы, например участки мозга с нарушенным кровоснабжением. Однако МРТ занимает больше времени, в некоторых центрах доступна в меньшей степени, и её изображения сложнее интерпретировать. Эта сложность делает МРТ привлекательной целью для ИИ‑инструментов, которые могут помогать радиологам, просеивая большие объёмы снимков, помечая подозрительные случаи и снижая риск пропуска тонких, но критичных кровоизлияний.

Почему для компьютеров трудно работать с несколькими видами и плоскостями

В рутинной клинической практике МРТ головного мозга часто выполняют с относительно толстыми срезами, чтобы сократить время обследования, в результате чего изображения обладают высокой резкостью в одних направлениях и гораздо меньшей — в других. Радиологи просматривают мозг в нескольких плоскостях — аксиальной (сверху вниз), сагиттальной (вид сбоку) и иногда корональной (вид спереди) — потому что некоторые кровоизлияния легче увидеть под определённым углом. Снимки также бывают в разных «контрастах» или вариантах (например, FLAIR, диффузия, чувствительность к магнитным веществам), каждый из которых подчёркивает разные свойства тканей. Большинство существующих систем ИИ, однако, предполагают, что все изображения выровнены в одну стандартную ориентацию и имеют одинаковое разрешение. Чтобы выполнить это требование, больницы вынуждены цифрово поворачивать и масштабировать данные, что может размывать мелкие детали и потенциально скрывать небольшие кровоизлияния. Реальные клинические наборы данных добавляют ещё одну сложность: не у всех пациентов есть одинаковый набор контрастов, поэтому модели должны уметь работать с отсутствующими фрагментами информации.

Новая многоплановая модель ИИ, сохраняющая больше исходной информации

Чтобы справиться с этими проблемами, авторы разработали «многоплановый vision-transformer» (MP-ViT), тип ИИ, изначально созданный для анализа натуральных изображений. Вместо того чтобы принудительно приводить все данные МРТ к одному виду, MP-ViT имеет две отдельные ветви обработки: одну для аксиальных изображений и одну для сагиттальных. Каждая ветвь делит трёхмерную модель мозга на небольшие блоки, преобразует их в токены, которые может обрабатывать трансформер, и затем обучается выявлять паттерны, указывающие на наличие кровоизлияния. Важно, что эти ветви не просто работают параллельно и остаются изолированными: модель использует механизм перекрёстного внимания (cross-attention), позволяющий ветвям обмениваться информацией, имитируя то, как радиолог мысленно комбинирует виды с разных углов для получения более ясной общей картины мозга.

Обработка отсутствующих типов сканов с помощью сигнала‑направителя

В реальных рабочих процессах больниц не у всех пациентов есть одинаковый набор контрастов МРТ; некоторые могут не проходить определённые последовательности, чувствительные к кровоизлиянию. Чтобы сделать ИИ устойчивым к таким пропускам, авторы добавили «вектор указания модальностей» — простой код, который сообщает модели, какие типы изображений доступны, а каких нет для данного пациента. Этот вектор преобразуется в набор внутренних сигналов, которые взаимодействуют с изученными моделью признаками через дополнительный шаг перекрёстного внимания. По сути, сеть направляют корректировать свои ожидания, когда какого‑то вида информации нет, вместо того чтобы запутаться или стать чрезмерно уверенной. Такая конструкция делает MP-ViT более пригодным для грязных и непоследовательных данных, которые возникают в повседневной клинической практике.

Насколько хорошо работает новый метод

Исследователи обучали и тестировали MP-ViT на большой реальной выборке из более чем 12 000 МРТ‑исследований от трёх крупных производителей томографов, размеченных опытными радиологами как «острое или субострое внутричерепное кровоизлияние» либо «без кровоизлияния». На независимом тестовом наборе MP-ViT показал площадь под кривой ROC (AUC) 0,854 — показатель того, насколько хорошо модель отделяет случаи с кровоизлиянием от без него при разных порогах принятия решения. Этот результат был заметно выше по сравнению со стандартным vision-transformer, работающим в одной плоскости, а также с несколькими известными архитектурами сверточных нейронных сетей, такими как ResNet и DenseNet. Статистические тесты подтвердили, что улучшения вряд ли случайны. Внутренний анализ также показал, что включение вектора указания модальностей повысило точность более чем на один процентный пункт, подчёркивая ценность явного указания модели, какие типы сканов у неё имеются.

Что это может значить для будущего ухода

Для неспециалиста главное: исследование демонстрирует более умный способ, которым ИИ может читать МРТ — он смотрит на мозг с нескольких углов, сохраняет больше исходных деталей и адаптируется, когда отсутствуют некоторые типы изображений. Хотя работа оценивалась на одном внутреннем наборе данных и была сосредоточена только на классификации, а не на точном контурировании кровоизлияний, она показывает, что тщательно спроектированные трансформеры лучше соответствуют грязной реальности клинической визуализации. При более широком подтверждении и ответственном внедрении в больничные рабочие процессы такие методы, как MP-ViT, могут помочь радиологам более надёжно обнаруживать кровоизлияния как в экстренных ситуациях при инсульте, так и при рутинных амбулаторных обследованиях, потенциально ускоряя лечение и повышая безопасность пациентов.

Цитирование: Das, B.K., Zhao, G., Mailhe, B. et al. Multi-plane vision transformer for hemorrhage classification using axial and sagittal MRI data. Sci Rep 16, 9333 (2026). https://doi.org/10.1038/s41598-026-44524-2

Ключевые слова: черепно-мозговое кровоизлияние, МРТ, ИИ в медицинской визуализации, vision-transformer, диагностика инсульта