Clear Sky Science · ru

Модель глубокого обучения, объединяющая структурированные данные и клинический текст, для прогнозирования рецидива фибрилляции предсердий

2026-02-16 · Назад к списку

Почему это важно для людей с нерегулярным сердцебиением

Фибрилляция предсердий, распространённая проблема сердечного ритма, часто возвращается даже после катетерной аблации — инвазивной процедуры, направленной на восстановление нормального ритма. Многие пациенты и врачи остаются в неведении: у кого риск рецидива выше, а кто может чувствовать себя спокойнее? В этом исследовании показано, как современные методы искусственного интеллекта могут просеивать как числовые данные, так и врачебные записи в истории болезни, чтобы точнее предсказать вероятность возвращения фибрилляции предсердий, что потенциально поможет в планировании наблюдения и предотвращении повторных вмешательств.

Трудная проблема сердечного ритма, которая часто возвращается

Катетерная аблация широко применяется при лечении фибрилляции предсердий: с её помощью прижигают или замораживают небольшие участки внутри сердца, запускающие или поддерживающие нарушения ритма. Тем не менее у 30–50% пациентов в течение года наблюдается рецидив аритмии, и иногда требуется повторная процедура. Существующие шкалы риска, в основном основанные на нескольких показателях, таких как размер камер сердца и тип фибрилляции, дают лишь частичную картину. Обычно они не учитывают подробности о том, как была выполнена процедура, как выглядело сердце на УЗИ, и нюансы состояния пациента, которые остаются в текстовых отчётах. В результате врачам всё ещё трудно определить, кому действительно требуется особенно тщательное наблюдение или дополнительная профилактическая терапия.

Преобразование рутинных больничных данных в более умный инструмент прогнозирования

Исследователи из Китая собрали информацию о 2508 пациентах, которым выполняли аблацию фибрилляции предсердий в пяти больницах в период с 2015 по 2024 год. Типичный пациент был 65 лет, и примерно у одного из пяти наблюдался рецидив нарушения ритма в ходе медианного наблюдения почти три года. Для каждого пациента команда собрала структурированные данные — такие как возраст, артериальное давление, результаты анализов крови, размеры камер сердца и существующие шкалы риска — а также неструктурированные тексты, включая сводки по 24‑часовому мониторингу, отчёты УЗИ и подробные протоколы процедур, написанные электрофизиологами. Затем они построили двухветвевую модель глубокого обучения: одна ветвь обрабатывала числовые и категориальные данные, а другая использовала большие языковые модели для преобразования свободнотекстовых отчётов в количественные признаки, которые можно было объединить с числовыми данными.

Как продвинутые языковые модели читают записи врачей

Текстовая ветвь системы опиралась на четыре современные большие языковые модели, изначально обученные на огромных корпусах текстов и затем адаптированные к медицинскому языку. Эти модели были дообучены на деперсонифицированных госпитальных отчётах, чтобы лучше улавливать специализированную лексику и шаблоны. В исследовании сравнивали разные языковые модели, чтобы определить, какие текстовые признаки лучше предсказывают рецидив. Лучшим оказался MedGemma — модель, специально оптимизированная для медицинского контента. Когда её текстовые признаки объединили со структурированной ветвью, итоговая модель «MedGemma‑Fusion» продемонстрировала впечатляющую точность: площадь под кривой оператора приёма‑ошибки (AUC) превысила 0,90 на обучающем наборе, валидации и в независимых тестовых больницах. Это означало, что модель надёжно различала пациентов, у которых аритмия не вернётся, и тех, у кого она вернётся.

Заглядывая внутрь «чёрного ящика» ИИ

Чтобы понять, какие именно входные данные использовала модель для прогнозов, исследователи применили инструменты интерпретируемости, оценивающие вклад каждого признака. Среди структурированных данных наибольшую значимость имели знакомые клинические факторы: длительность заболевания фибрилляцией предсердий, размер левого предсердия и то, был ли ритм преходящим или персистирующим. Со стороны текстов в лидеры вышли ключевые понятия, связанные с проведением аблации — например, описания лёгочных вен и электрических потенциалов — что отражает этапы, критичные для успешного лечения. Также значимыми оказались термины, описывающие движение сердца в отчётах УЗИ, что согласуется с идеей о том, что изменения сократимости предсердий сигнализируют о длительном повреждении. В отличие от этого, сводки 24‑часового мониторинга внесли относительно небольшой вклад, вероятно потому, что у многих пациентов с пароксизмальной фибрилляцией предсердий ритм в короткие промежутки мониторинга может быть нормальным.

От исследовательской модели к клиническим решениям

Помимо чистой точности, команда проверила, насколько хорошо их инструмент разделяет пациентов на группы высокого и низкого риска с помощью анализа выживаемости. Пациенты, которых MedGemma‑Fusion отнесла к группе высокого риска, демонстрировали явно более высокий уровень рецидивов с течением времени. Анализ кривых решения показал, что при многих разумных порогах использование модели для руководства уходом давало бы больший чистый эффект, чем опора только на традиционные шкалы или отдельные показатели. Тем не менее авторы подчёркивают важные оговорки: исследование ретроспективное, размеры выборки — хоть и большие для одного проекта — скромны для задач глубокого обучения, а стиль отчётности варьировался между больницами. Требуются дальнейшие версии больших языковых моделей и более широкое тестирование в других системах здравоохранения, прежде чем такие инструменты станут рутинными. Тем не менее эта работа иллюстрирует, как сочетание повседневных числовых данных в истории болезни и нюансов, скрытых в текстовых отчётах, может сделать прогнозы точнее и в перспективе помочь персонализировать наблюдение и интенсивность лечения для людей с фибрилляцией предсердий.

Цитирование: Jia, S., Yin, Y., Guan, Y. et al. A deep learning model integrating structured data and clinical text for predicting atrial fibrillation recurrence. npj Digit. Med. 9, 253 (2026). https://doi.org/10.1038/s41746-026-02436-5

Ключевые слова: фибрилляция предсердий, катетерная аблация, глубокое обучение, анализ клинических текстов, прогнозирование риска