Clear Sky Science · ru
MIMIC-III-Ext-PPG — эталонный набор данных на основе PPG для анализа сердечно-сосудистых и дыхательных сигналов
Почему показания с запястных датчиков могут решить судьбу
Многие из нас носят умные часы, которые тихо отслеживают пульс круглосуточно. В отделениях интенсивной терапии регистрируется очень похожий световой сигнал — фотоплетизмограмма (PPG), — снятый круглосуточно у тяжело больных пациентов. Эта статья представляет MIMIC-III-Ext-PPG, крупнейшую и наиболее детализированную публичную коллекцию таких пульсовых сигналов на сегодняшний день, предназначенную для помощи исследователям в разработке и тестировании новых алгоритмов обнаружения опасных сердечных ритмов, бесконтурной оценки артериального давления и отслеживания дыхания. 
Огромная библиотека снимков пульса
Авторы собрали более 6,3 миллиона коротких фрагментов PPG по 30 секунд из данных 6 189 пациентов отделений интенсивной терапии, включённых в хорошо известную больничную базу MIMIC-III. Каждый фрагмент фиксирует, как свет, проходящий через кончик пальца, меняется с каждым сердечным сокращением — простое измерение, доступное сегодня как на прикроватных мониторах, так и на потребительских носимых устройствах. Для многих фрагментов в наборе данных также доступны синхронизированные электрокардиограмма, кровяное давление и дыхательные сигналы, превращая каждый снимок пульса в богатое, многосигнальное окно в состояние сердца и лёгких.
От записей у постели больного до подробных меток ритма
Особенность этого набора данных — не только его масштаб, но и метки. В оригинальной больничной системе медсёстры и врачи регулярно записывали ритм сердца пациента в электронных картах. Команда аккуратно сопоставила эти записи с точными временными интервалами, покрываемыми волновыми записями, затем унифицировала разные системы записи в единый согласованный набор из 26 типов сердечного ритма. Они включают нормальный ритм и простое учащение или замедление, различные предсердные и желудочковые аритмии, ритмы, вызванные кардиостимулятором, и полные блокады проводимости. Такая детализация значительно превосходит предыдущие наборы данных на основе пульса, которые обычно предлагали только одну-две категории ритма.
Измерение не только сердцебиения
Чтобы поддержать разнообразие исследований, авторы извлекли ряд базовых жизненных показателей непосредственно из сигналов. Из кривых кровяного давления они вычислили типичные верхнее и нижнее давления; из дыхательного сигнала — оценили частоту дыхания; а из электрокардиограммы — частоту сердечных сокращений. Эти значения рассчитывались в коротких временных окнах с использованием проверенных открытых алгоритмов и правил хорошей практики, чтобы избежать ложных показаний. Пакетируя эти измерения с каждым 30-секундным сегментом, набор данных позволяет исследователям тестировать алгоритмы, предсказывающие артериальное давление, частоту сердечных сокращений или частоту дыхания только по пульсовому сигналу, а также изучать, как эти показатели меняются вместе.
Гарантия надежности сигналов
Реальные данные из больниц могут быть неряшливыми: датчики слетают, пациенты двигаются, кабели отключаются. Чтобы избежать вводящих в заблуждение анализов, команда создала конвейер проверки качества сигналов, который скринирует каждый сегмент. Для каждого типа сигнала они проверяли наличие плоских линий, пропущенных значений, неправдоподобных частот сердца или дыхания и несоответствующих форм импульсов. Сегменты, прошедшие все проверки, отмечались как высокого качества; те, у которых были незначительные проблемы, но информация всё ещё была полезна, помечались как низкого качества; а сегменты с серьёзными проблемами исключались полностью. Авторы также верифицировали одну ключевую метку — фибрилляцию предсердий — сравнив её с экспертно проверенными аннотациями электрокардиограмм из другого исследования, обнаружив высокое согласие и почти идеальную специфичность. 
Основа для будущих алгоритмов в медицине
Объединяя огромный масштаб, подробные метки сердечного ритма, несколько синхронизированных сигналов и явные оценки качества, MIMIC-III-Ext-PPG предоставляет мощную тестовую площадку для медицины, основанной на данных. Исследователи могут использовать его для бенчмаркинга новых методов обнаружения нерегулярных сердечных сокращений с датчиков, похожих на запястные, для бесконтурной оценки артериального давления или для построения многозадачных моделей, обучающихся нескольким жизненным показателям одновременно. Хотя этот набор данных сам по себе не предназначен для принятия решений в режиме реального времени, он прокладывает дорогу к более надёжным и обобщаемым алгоритмам, которые однажды смогут превратить повседневные датчики пульса в системы раннего предупреждения о серьёзных проблемах сердца и лёгких.
Цитирование: Moulaeifard, M., Kutscher, M., Aston, P.J. et al. MIMIC-III-Ext-PPG, a PPG-based Benchmark Dataset for Cardiovascular and Respiratory Signal Analysis. Sci Data 13, 668 (2026). https://doi.org/10.1038/s41597-026-07335-8
Ключевые слова: фотоплетизмография, обнаружение аритмий, данные отделений интенсивной терапии, оценка артериального давления, носимые медицинские датчики