Clear Sky Science · ru
Точность диагностики, справедливость и клиническая реализация ИИ для скрининга рака молочной железы: результаты многоцентровых ретроспективных и проспективных технических исследований осуществимости
Умнее́йший скрининг для повседневных женщин
Скрининг рака молочной железы спасает жизни, но также нагружает системы здравоохранения и может пропускать опухоли или вызывать стресс из‑за ложных тревог. В этом исследовании ставится простой, но важный вопрос: может ли программа искусственного интеллекта (ИИ) безопасно помогать читать маммограммы в национальной программе скрининга Великобритании, выявляя больше опасных опухолей и одновременно снижая нагрузку на занятых специалистов — и делать это справедливо для женщин из разных слоёв общества?

Как сегодня проводится скрининг
Во многих странах, включая Соединённое Королевство, женщинам в возрасте 50–70 лет приглашают на регулярные маммограммы. В Великобритании каждое обследование обычно независимо читают два специалиста; если они не сходятся во мнении, дело рассматривает панель. Эта система двойного чтения задумана как безопасная, но требует много времени и зависит от наличия достаточного числа обученных ридеров — чего во многих системах здравоохранения не хватает. Ранние компьютерные инструменты оказывали лишь ограниченную помощь и иногда добавляли шум вместо ясности, поэтому органы здравоохранения требовали убедительных новых доказательств, прежде чем доверить современные ИИ национальным программам.
Испытание ИИ в реальных клиниках
Исследователи оценили обновлённый ИИ для маммографии от Google в двух крупных фазах в рамках Национальной службы здравоохранения Великобритании. Сначала они запустили систему на почти 116 000 прошлых скрининговых исследований из пяти разных регионов и отслеживали женщин более трёх лет, чтобы установить, какие опухоли действительно проявились. Затем сравнили работу ИИ с первым и вторым человеком‑ридером и с итоговым решением панели. Во второй фазе ИИ тихо внедрили в 12 скрининговых центров и позволили ему в реальном времени обработать более 9 000 новых исследований — не влияя на уход — чтобы изучить поведение системы в повседневной практике и понять, какие настройки потребуют донастройки.
Что увидел ИИ — и что он обнаружил
На большом ретроспективном наборе данных ИИ оказался более чувствительным, чем первый человек‑ридер: он выявил больше случаев рака в целом, сохранив при этом уровень ложных тревог в пределах заранее заданного безопасного порога. Если бы систему использовали в роли одного из двух ридеров, уровень выявления рака вырос бы примерно с 7,5 до 9,3 случаев на 1 000 женщин, и она правильно отметила одну из четырёх опухолей, которые изначально были пропущены и обнаружились позже — либо между скринингами, либо на следующем плановом осмотре. Прирост был особенно заметен у женщин, пришедших на первое обследование — обычно самой трудной группы для интерпретации, поскольку отсутствуют предшествующие снимки. При этих первичных визитах ИИ направлял на дообследование меньше женщин и при этом выявлял немного больше случаев рака, особенно инвазивных опухолей, представляющих наибольшую угрозу.
Справедливость, нагрузка и реальные препятствия
Команда внимательно изучила, одинаково ли ИИ относится к разным группам женщин. По возрасту, плотности молочной железы, социально‑экономическому статусу и по ограниченным доступным данным об этнической принадлежности систематических признаков вредоносного смещения не обнаружили: чувствительность и специфичность оставались в узких пределах по сравнению с человеческими ридерами, хотя для некоторых очень небольших подгрупп неопределённость была большой. Они также смоделировали, как использование ИИ в роли второго ридера изменит рабочую нагрузку. Число чтений человеком перед рассмотрением панелью могло сократиться почти вдвое, уменьшив время ридера примерно на треть, несмотря на то, что больше случаев отправлялось бы на панель. В фазе живого тестирования ИИ выдавал результаты за считанные минуты — намного быстрее, чем обычное человеческое чтение — но команда обнаружила изменение внешнего вида недавних изображений по сравнению со старыми данными обучения. Первоначальный рабочий порог оказался слишком чувствительным, что вызывало более высокие показатели вызовов на дообследование, и его пришлось пересчитать в сторону понижения с использованием свежих локальных данных.

Создание готовой к ИИ системы скрининга
Помимо точности, исследование выявило практические барьеры для безопасного внедрения. Многие центры скрининга по‑прежнему полагаются на бумажные формы и устаревшее программное обеспечение, которое не может автоматически сохранять результаты ИИ или объяснять, почему скан был направлен на дообследование — функции, необходимые регуляторам и клиницистам. Авторы утверждают, что полностью цифровые стандартизованные рабочие процессы и лучшее собирание демографических данных станут ключевыми для мониторинга производительности и справедливости с течением времени. Они также подчёркивают, что пороги ИИ нельзя просто «установить и забыть»: оборудование для съёмки, поведение ридеров и состав популяции меняются, поэтому систему нужно постоянно проверять и корректировать при наличии чётких национальных правил и технической поддержки.
Что это значит для пациенток
Результаты указывают на то, что при аккуратном развертывании система ИИ может помочь национальным программам скрининга молочной железы выявлять более серьёзные опухоли на ранних стадиях, особенно у женщин, пришедших на первую маммографию, и одновременно снижать нагрузку на перегруженных специалистов. Однако авторы подчёркивают, что успех зависит не только от точного алгоритма. Службам здравоохранения потребуется постоянная калибровка, строгий мониторинг дрейфа и смещения, обновлённая IT‑инфраструктура и продуманная интеграция в существующие человеческие рабочие процессы. При наличии этих мер предосторожности ИИ может стать надёжным дополнительным ридером, повышающим и эффективность, и справедливость скрининга рака молочной железы, а не чёрным ящиком, создающим новые риски.
Цитирование: Kelly, C.J., Wilson, M., Warren, L.M. et al. Diagnostic accuracy, fairness and clinical implementation of AI for breast cancer screening: results of multicenter retrospective and prospective technical feasibility studies. Nat Cancer 7, 494–506 (2026). https://doi.org/10.1038/s43018-026-01127-0
Ключевые слова: скрининг рака молочной железы, медицинский искусственный интеллект, маммография, справедливость в здравоохранении, клиническая реализация