Clear Sky Science · ru

Сравнение эффективности искусственного интеллекта и медицинских специалистов при анализе хирургических и интервенционных видео: систематический обзор и метаанализ

2026-03-06 · Назад к списку

Более внимательный взгляд в операционной

Ежегодно сотни миллионов людей проходят операции и малоинвазивные вмешательства под визуальным контролем — думайте о колоноскопиях, лапароскопии или миниатюрных камерах, вводимых в кровеносные сосуды. В такие моменты способность врача заметить тонкие предупреждающие признаки на экране может означать разницу между ранним обнаружением рака и пропуском болезни. Это исследование задаёт вопрос, важный для любого будущего пациента: каков результат анализа хирургических и интервенционных видео с точки зрения работы систем искусственного интеллекта по сравнению с клиницистами и что происходит, когда они работают вместе?

Упорядочивание потока хирургического видео

Современная медицина записывает огромное количество видео процедур — от эндоскопии пищеварительного тракта до операций с роботической поддержкой. Эти записи богаты информацией: крошечные полипы в толстой кишке, ранние опухоли в желудке или пищеводе, тонкие нервы, которых нужно избегать, или этапы сложной операции. Исследователи обучают системы ИИ сканировать такие изображения, отмечать подозрительные участки и даже распознавать, на каком этапе процедуры находятся хирурги. Однако до сих пор большинство работ сопоставляли ИИ и врачей в искусственных состязаниях «один на один», вместо того чтобы изучать, как эту технологию можно реально использовать — как помощника у плеча клинициста. Этот обзор поставил задачу систематически собрать и проанализировать рассеянные данные по многим специальностям.

Что изучали исследователи

Команда искала по основным медицинским и инженерным базам данных и начала с почти 38 000 статей. После применения строгих критериев — только первичные исследования, использующие ИИ на реальных хирургических или интервенционных видео и непосредственно сравнивающие его работу с результатами медицинских специалистов — в итоге осталось 146 исследований. Они охватывали широкий спектр процедур, особенно эндоскопию желудочно-кишечного тракта, а также вмешательства в легких, щитовидной железе, головном мозге, сердце и в урологии. Большинство использовали современные методы глубокого обучения, такие как свёрточные нейронные сети, обученные обнаруживать болезни, распознавать анатомию, оценивать чистоту кишечника или определять этапы операции. В 76 исследованиях было представлено достаточно данных, чтобы объединить результаты и вычислить, как часто ИИ и люди оказывались правы или ошибались.

ИИ в одиночку по сравнению с врачами и ИИ в роли напарника

При сравнении ИИ с врачами, работающими без помощи, системы ИИ, как правило, выявляли больше действительно существующих проблем (более высокая чувствительность), не вызывая при этом большего числа ложных тревог (схожая специфичность). Такая картина сохранялась как при тестировании моделей на знакомых данных, так и при испытаниях на новых внешних наборах данных. Однако наиболее клинически значимым оказалось то, что происходило при использовании ИИ в роли ассистента. По множеству задач клиницисты, имевшие доступ к подсказкам ИИ, лучше находили заболевания и реже ошибочно классифицировали нормальные ткани, чем те, кто работал в одиночку. Это улучшение было особенно заметно для неэкспертов, например для обучающихся, которые получили наибольшую выгоду от руководства ИИ. Для опытных специалистов эффективность с помощью ИИ и эффективность ИИ в одиночку оказались примерно сопоставимы, что указывает на то, что в руках эксперта человеческо‑машинная комбинация может соответствовать лучшим отдельным алгоритмам.

Разрыв между лабораторными условиями и реальной клиникой

Несмотря на многообещающие показатели, обзор подчёркивает разрыв между тем, как ИИ сейчас тестируют, и тем, как он должен работать в реальной клинической практике. Во многих исследованиях данные очищали, удаляя размытые или низкокачественные кадры, хотя в реальных операционных и эндоскопических кабинетах часто приходится иметь дело именно с такими дефектами. Другие анализировали изолированные снимки вместо непрерывного видео, избегая вызова, связанного с отслеживанием движения и времени. Мало кто оценивал ИИ в реальном времени у постели больного, и большинство опиралось на дорогое оборудование, которое может быть недоступно в медицинских учреждениях с ограниченными ресурсами. Практики отчётности также были непоследовательны: ключевые детали о том, как настраивались и валидировались модели, часто отсутствовали, что затрудняет воспроизведение или справедливую оценку результатов другими командами.

Формирование надёжного партнёрства человека и ИИ

Авторы утверждают, что ИИ в хирургии и интервенционной медицине следует разрабатывать и тестировать изначально как партнёра для клиницистов, а не как замену. Это означает проектирование исследований, отражающих условия реальной практики, обмен разнообразными видео наборами данных между центрами и принятие прозрачных стандартов отчётности, чтобы другие команды могли проверить и улучшить опубликованные работы. Это также подразумевает обучение врачей пониманию сильных сторон и предвзятостей ИИ, а не слепое доверие или отвержение его подсказок. В то время как метаанализ показывает, что ИИ уже может соперничать с врачами без помощи или превосходить их во многих задачах, наиболее значимая выгода заключается в том, как он может обострить человеческое суждение. Для пациентов вывод не в том, что машины захватят операционную, а в том, что хорошо продуманные команды человек–ИИ могут сделать процедуры безопаснее, диагнозы — более ранними, а исходы — лучше.

Цитирование: Rafati Fard, A., Williams, S.C., Smith, K.J. et al. Comparing artificial intelligence and healthcare professional performance in surgical and interventional video analysis: a systematic review and meta-analysis. npj Digit. Med. 9, 323 (2026). https://doi.org/10.1038/s41746-026-02401-2

Ключевые слова: хирургическое видео ИИ, компьютерно-поддерживаемая эндоскопия, взаимодействие человека и ИИ, анализ медицинских изображений, клиническая поддержка принятия решений