Clear Sky Science · ru

Метод сегментации изображений спленомегалии в магнитно‑резонансной томографии на основе многомасштабного механизма внимания с крупными ядрами

2026-01-14 · Назад к списку

Почему врачам важно увеличение селезёнки

Селезёнка — орган размером с кулак, расположенный под левой нижней рёберной клеткой; она незаметно фильтрует кровь, борется с инфекциями и участвует в регуляции некоторых форменных элементов крови. Когда она увеличивается — состояние, известное как спленомегалия — это может указывать на серьёзные проблемы, от заболеваний печени до онкологических поражений крови. Современные сканеры в больницах получают детальные изображения селезёнки, но превращение этих изображений в надёжные измерения по‑прежнему часто требует трудоёмкой и подверженной ошибкам ручной работы специалистов. В этой работе представлен новый метод искусственного интеллекта, который автоматически выделяет увеличенные селезёнки на МР‑изображениях с очень высокой точностью, потенциально предоставляя врачам быстрое и более точное средство для диагностики и мониторинга.

Сложность в чёткости визуализации селезёнки

На МР‑изображениях селезёнка не всегда выделяется так отчётливо, как многие ожидают: её серый тон часто очень похож на соседние органы и ткани. Усугубляет ситуацию то, что селезёнки сильно различаются по размеру и форме у разных пациентов, особенно при патологическом увеличении. У одних объём селезёнки лишь слегка повышен, у других орган может быть во много раз больше нормы. Получение качественных снимков таких крайних случаев на практике также затруднено, поэтому исследователи вынуждены работать с относительно небольшими наборами данных. Всё это означает, что традиционные алгоритмы и даже ранние методы глубокого обучения испытывают трудности при проведении чёткой и точной разметки границ селезёнки на срезах МРТ.

Более умная сеть для сложных медицинских изображений

Авторы предлагают новую архитектуру глубокого обучения под названием LMA‑Net (Large‑kernel Multi‑scale Attention Net), специально разработанную для этой задачи. Она следует U‑образной структуре, ставшей стандартом в анализе медицинских изображений: одна сторона «U» постепенно сжимает изображение в абстрактные признаки (энкодер), а другая восстанавливает подробную карту сегментации (декодер). LMA‑Net использует гибридный энкодер, сочетающий две мощные идеи. Сначала классическая сверточная сеть ResNet‑50 улавливает тонкие локальные детали. Затем модуль Transformer, перенятый из современных языковых и визуальных моделей, захватывает более широкие закономерности по всему изображению, помогая алгоритму сформировать глобальное представление о расположении и типичном виде селезёнки.

Обучение фокусироваться на нужных деталях

Между энкодером и декодером LMA‑Net добавляет специализированный блок внимания, который одновременно рассматривает изображение на нескольких масштабах. Он использует необычно крупные свёрточные фильтры вместе с эффективной стратегией группировки, чтобы расширить поле зрения без чрезмерного замедления или роста модели. Эти крупные фильтры помогают сети видеть весь контур селезёнки, а не только мелкие фрагменты, что критично при расплывчатых границах. Затем модель обучается присваивать более высокие веса наиболее информативным каналам и локализациям, фактически «уделяя внимание» регионам и текстурам, которые с наибольшей вероятностью относятся к селезёнке. В декодере лёгкий модуль слияния и блок уточнения границы дополнительно заостряют контуры органа, стремясь к гладким, реалистичным очертаниям при сохранении умеренной вычислительной нагрузки, приемлемой для клинического использования.

Как система работает на практике

Чтобы проверить подход, исследователи обучили и оценили LMA‑Net на двух различных коллекциях медицинских изображений. Один набор данных содержал МР‑сканы 51 пациента с разной степенью спленомегалии, с точной разметкой, выполненной опытными радиологами. Другой набор пришёл из публичного Medical Segmentation Decathlon и состоял из КТ‑сканов, сфокусированных на селезёнке. Используя общепринятые метрики точности, сравнивающие перекрытие между прогнозируемыми и экспертными размеченными областями, LMA‑Net превзошёл несколько популярных сетей сегментации, включая U‑Net, а также более свежие модели на основе внимания и Transformer. На наборе МРТ со спленомегалией среднее совпадение с экспертной разметкой составило более 96% площади селезёнки, что является заметным улучшением по сравнению с конкурентами.

Что это может означать для пациентов и клиник

Для неспециалистов главное — этот новый метод ИИ может автоматически и очень точно выделять увеличенные селезёнки на рутинных МР‑сканах, даже когда форма органа необычна или его края плохо различимы. Это означает, что врачи смогут быстрее получать точные объёмы и формы селезёнки, отслеживать изменения во времени и лучше оценивать ответ пациентов на лечение заболеваний печени, заболеваний крови или онкологических процессов, затрагивающих селезёнку. Хотя необходимы дальнейшая валидация и интеграция в больничные системы, LMA‑Net указывает на будущее, в котором детальные количественные измерения по медицинским изображениям станут стандартным автоматизированным элементом ухода, а не ручной рутиной.

Цитирование: Fu, Z., Zhao, C., Yan, H. et al. A method for magnetic resonance splenomegaly image segmentation based on large-kernel multi-scale attention mechanism. Sci Rep 16, 5227 (2026). https://doi.org/10.1038/s41598-026-35122-3

Ключевые слова: спленомегалия, сегментация МРТ, глубокое обучение, медицинская визуализация, сети внимания