Clear Sky Science · ru

Механизм смешанного внимания и многозадачное обучение для распознавания стандартных сечений живота плода и обнаружения ключевых анатомических структур

2026-04-14 · Назад к списку

Помощь врачам до рождения

Пренатальное УЗИ — одно из первых окошек, через которое родители и врачи могут заглянуть в состояние здоровья будущего ребенка. Однако чтение этих зернистых черно‑белых изображений — навык, требующий многих лет практики, и небольшие детали могут означать разницу между ранним выявлением проблемы и её пропуском. В этом исследовании представлена компьютерная система, призванная помочь: инструмент искусственного интеллекта, который быстро распознает стандартные виды живота плода и выделяет ключевые органы, на которые обращают внимание врачи при рутинных пренатальных скринингах.

Почему важны стандартные сечения

Когда беременная женщина проходит УЗИ в середине беременности, клиницист не просто «осматривает» изображение. Он целенаправленно ищет набор стандартных сечений плода. Для области живота это включается поперечные срезы для измерения окружности, кадры, сфокусированные на мочевом пузыре, пуповине, а также несколько ракурсов почек и позвоночника. В совокупности эти плоскости позволяют врачам оценивать рост, проверять структурные повреждения и оценивать риски при рождении. Получение каждого стандартного сечения требует точных движений рукой и хорошего знания анатомии, а схожие по виду срезы легко перепутать — особенно у менее опытного персонала или при зашумленных изображениях.

Преобразование ультразвуковых изображений в данные

Чтобы обучить компьютер помогать в этой задаче, исследователи сначала собрали большую коллекцию реальных изображений. В течение четырех лет они накопили более 6700 изображений живота плода у более чем 3100 беременных женщин в нескольких больницах, используя разные аппараты. Опытные врачи‑ультразвуковики аккуратно обвели 14 ключевых анатомических структур на каждом изображении — такие как желудок, мочевой пузырь, почки, крупные сосуды, позвоночник, ребра и пуповина — и пометили, какому из семи стандартных видов живота соответствует каждое изображение. Этот трудоемкий процесс разметки создал богатую «карту», связывающую паттерны пикселей с клинически значимыми структурами.

Двуцелевая система ИИ с направленным вниманием

Опираясь на этот набор данных, команда разработала модель глубокого обучения, названную FAUSP‑NET. В отличие от систем, выполняющих только одну задачу, FAUSP‑NET — многозадачная сеть: за один проход она и ограничивает ключевые органы прямоугольными рамками, и определяет, к какому стандартному виду принадлежит изображение. В основе модели лежит современный бэкбон для обнаружения объектов, дополненный несколькими компонентами «внимания», которые помогают сосредоточиться на наиболее информативных областях и масштабах. Некоторые блоки внимания подчеркивают тонкие различия между похожими структурами (например, левая и правая почка или пуповина и соседние сосуды), в то время как другие адаптируются к органам очень разных размеров. Специально разработанная функция потерь помогает системе учиться на редких или плохо различимых структурах, улучшая точность их выделения.

Насколько хорошо работает система

После обучения FAUSP‑NET протестировали на отложенных изображениях и сравнили с 24 существующими моделями компьютерного зрения, включая популярные детекторы объектов и классификаторы изображений. Она оказалась точнее всех них как в задаче обнаружения органов, так и в распознавании стандартных сечений. При обнаружении органов модель в подавляющем большинстве случаев корректно совпадала с разметкой врачей и с высокой степенью надежности обрабатывала большинство структур; сложными оставались лишь самые чуть заметные и мелкие объекты, такие как отдельные сосуды и диафрагма. В задаче распознавания видов система правильно относила изображение к одному из семи абдоминальных сечений более чем в 97% случаев. На стандартном оборудовании обработка одного изображения занимала примерно 24 миллисекунды — достаточно быстро для использования в реальном времени во время обследования.

Сравнение ИИ с врачами‑экспертами

Чтобы понять, как инструмент сопоставим с реальными клиницистами, исследователи оценили его на полностью отдельной выборке изображений из другой больницы и сравнили результаты с данными начинающих, врачей среднего уровня и старших ультразвуковиков. Точность FAUSP‑NET в обнаружении структур и идентификации стандартных сечений приближалась к показателям опытных старших врачей или соответствовала им, и заметно превосходила результаты менее опытных специалистов. Важный момент: система завершала анализ быстрее, чем старший врач — менее чем за сотую часть времени, которое требовалось человеку для просмотра тех же случаев. Визуализационные методы показали, что модель обычно фокусируется на тех же областях, на которые опираются эксперты‑люди, что поддерживает её объяснимость и потенциальную приемлемость в клинической практике.

Что это значит для будущих родителей

Проще говоря, эта работа демонстрирует, что правильно обученная система ИИ может выступать в роли второго взгляда при пренатальных обследованиях живота плода. FAUSP‑NET может быстро указать, захвачено ли правильное сечение живота и хорошо ли видны ключевые органы, помогая менее опытным сонографистам избегать ошибок и освобождая специалистов для работы со сложными случаями. Хотя необходимы дополнительные испытания в большем числе больниц и на разных аппаратах, технология указывает на будущее, в котором рутинные пренатальные УЗИ будут более последовательными, быстрыми и менее зависимыми от того, кто держит датчик, что потенциально улучшит уход за матерями и детьми.

Цитирование: Li, Y., Huang, Y., Liu, Z. et al. Mixed attention mechanism multi-task learning for fetal abdominal standard plane recognition and key anatomical structure detection. Sci Rep 16, 12324 (2026). https://doi.org/10.1038/s41598-026-40590-8

Ключевые слова: пренатальное УЗИ, живот плода, глубокое обучение, обнаружение стандартных сечений, анализ медицинских изображений