Clear Sky Science · ru

Оценка состояния сердца в разных сценариях и на разных устройствах с помощью мультимодальной фундаментальной модели, предварительно обученной на данных 1,7 миллиона человек

· Назад к списку

Почему данные о вашем сердцебиении важны

От больничных мониторов до умных часов — всё больше аспектов нашей жизни фиксируется с помощью крошечных электрических и оптических сигналов сердца. Эти записи могут выявлять опасные нарушения ритма, оценивать кровяное давление без манжеты и даже давать подсказки о будущем риске для сердца. Но поскольку устройства и условия съёма сильно различаются, современные алгоритмы часто хорошо работают лишь в тех узких ситуациях, для которых их создавали. В этом исследовании представлена новая разновидность «фундаментальной» модели для сигналов сердца, цель которой — понимать кардиальное здоровье одновременно в разных устройствах, странах и сценариях применения.

Figure 1
Figure 1.

Разные способы «прослушать» сердце

Врачи и приборы могут регистрировать работу сердца несколькими способами. Классический больничный тест — 12‑отводная электрокардиограмма (ЭКГ), когда электроды располагают по грудной клетке и конечностям, чтобы зафиксировать электрическую активность сердца под разными углами. В реанимациях часто используют меньше отводов и оптический датчик — фотоплетизмограмму (ФПГ), который подсвечивает кожу и отслеживает пульсацию крови в сосудах. Дома умные часы и пластыри могут снимать лишь один канал ЭКГ или только ФПГ. Каждая из этих конфигураций даёт сигналы с разной формой, длиной и числом каналов, что затрудняло создание единой модели, работающей везде. Традиционные подходы обычно обучают отдельные, специально настроенные алгоритмы под каждое устройство и задачу, и они с трудом переносятся в новые условия или на другие популяции.

Один «мозг» для многих сердечных сигналов

Исследователи разработали кардиальную фундаментальную модель (CSFM), которая выступает общей «платформой» для всех этих сигналов. Вместо обучения на одном аккуратном наборе данных CSFM обучали на огромной и разнородной коллекции: примерно 1,7 миллиона записей сердца из нескольких больниц и стран, включающей как ЭКГ, так и ФПГ, а также текстовые отчёты, которые врачи или машины составляли по этим записям. Модель делит сигналы на короткие сегменты, превращает и сигналы, и слова в токены и подаёт их в трансформер — тип архитектуры глубокого обучения, стоящий за недавними прорывами в обработке языка и изображений. Во время обучения большие фрагменты токенов намеренно скрывают, и модель учится восстанавливать пропущенные части. Такое «маскирование» заставляет CSFM улавливать ключевые шаблоны, общие для разных устройств, отводов и языков описания.

От диагноза до давления и дальше

После обучения CSFM можно адаптировать к множеству практических задач, используя относительно небольшие размеченные наборы данных. Команда проверила модель на задачах классификации ритма и заболеваний сердца с использованием стандартных 12‑отводных ЭКГ, одноотводных ЭКГ с носимых устройств и ФПГ со смарт‑часов. Она не только соответствовала, но часто превосходила сильные специализированные глубокие сети. CSFM также помогала оценивать возраст, пол и индекс массы тела напрямую по коротким сегментам ЭКГ и ФПГ, показывая, что модель улавливает тонкие подсказки о человеке, а не только о сердцебиении. В другом наборе экспериментов модель преобразовывала ЭКГ и ФПГ в непрерывные кривые артериального давления, а затем в систолические и диастолические значения, давая более точные безманжетные оценки давления по сравнению с конкурирующими методами.

Figure 2
Figure 2.

Работа на разных устройствах и заполнение пробелов

Особенно важной проверкой было то, справится ли CSFM с ситуациями, когда доступна лишь часть обычной информации. Исследователи показали, что модели, дообученные на базе CSFM, хорошо работали как при наличии всех 12 отводов ЭКГ, так и при шести, двух распространённых отводах или даже при одном отводе. Они также тестировали комбинации входов только ЭКГ, только ФПГ и ЭКГ плюс ФПГ. Во всех этих вариантах системы на базе CSFM сохраняли высокую эффективность, тогда как традиционные модели падали сильнее. Внутренние представления модели можно было использовать и как готовые признаки для простых инструментов, таких как градиентный бустинг, часто достигая производительности, сопоставимой с полностью дообученными глубокими сетями. Наконец, добавив регрессионную голову, CSFM могла генерировать один тип сигнала из другого — например, синтезировать реалистичную ЭКГ по ФПГ‑треку или восстанавливать полную 12‑отводную ЭКГ по одному отводу — что открывает возможности для увеличения данных и улучшенного анализа, когда идеальные записи недоступны.

Что это может значить для пациентов

Для неспециалистов основной посыл таков: одна универсальная модель теперь может интерпретировать очень разные записи сердца и при этом давать точные, клинически полезные ответы. Вместо создания хрупкого алгоритма для каждого устройства и больницы CSFM предлагает общую основу, которую можно легко адаптировать под местные потребности — от обнаружения опасных аритмий на смарт‑часах до прогнозирования пациентов с повышенным риском смерти в течение года. Авторы признают существующие проблемы, такие как необходимость делать решения модели более понятными для клиницистов и снижать её вычислительные требования. Тем не менее их результаты позволяют предположить, что фундаментальные модели для сигналов сердца могут помочь расширить доступ к продвинутому кардиологическому мониторингу и оценке риска для большего числа людей в разных местах, с использованием уже имеющихся устройств.

Цитирование: Gu, X., Tang, W., Han, J. et al. Cardiac health assessment across scenarios and devices using a multimodal foundation model pretrained on data from 1.7 million individuals. Nat Mach Intell 8, 220–233 (2026). https://doi.org/10.1038/s42256-026-01180-5

Ключевые слова: кардиальная фундаментальная модель, электрокардиограмма, фотоплетизмография, цифровая кардиология, носимое мониторирование сердца