Clear Sky Science · zh

MIMIC-III-Ext-PPG:用于心血管和呼吸信号分析的基于PPG的基准数据集

· 返回目录

为什么腕部传感器能讲述生死攸关的故事

我们中许多人佩戴智能手表,日夜静静记录脉搏。在重症监护病房中,也会持续记录一种非常相似的光学信号,称为光电容积描记术(PPG),用于危重病人的全天候监测。本文介绍了MIMIC-III-Ext-PPG,这是迄今为止最大且最详尽的公开脉搏信号集合,旨在帮助研究者构建和测试用于检测危险心律、无袖带血压估计和呼吸监测的新算法。

Figure 1
Figure 1.

脉搏快照的巨大图书馆

作者从知名的MIMIC-III医院数据库中收集了超过6.3百万段、每段30秒的PPG短片段,来自6,189名重症患者。每段片段记录了光线穿过指尖随每次心跳而发生的变化——这一简单测量如今既存在于床旁监护仪,也存在于消费级可穿戴设备中。对于许多片段,数据集还包含同步的心电图、血压和呼吸信号,使每个脉搏快照成为一个关于心肺的丰富多信号观测窗口。

从床边记录到详细的心律标签

使该数据集脱颖而出的不仅是其规模,还有其标签。在原始医院系统中,护士和医生会在电子病历上定期记录患者的心律。研究团队将这些病历条目精确匹配到波形记录覆盖的时间段,然后将不同的记录系统统一为一套一致的26种心律类型。这些类型涵盖从正常节律及简单的心率加速或减慢,到各种房性与室性心律失常,再到起搏器驱动节律和完全传导阻滞。这样的细节层次远超早期基于脉搏的数据集,后者通常仅提供一到两类心律分类。

测量的不仅仅是心跳

为了支持多种研究,作者直接从信号中提取了一系列基本生命体征。从血压波形计算了典型的收缩压和舒张压;从呼吸信号估算了呼吸频率;从心电图导出了心率。这些数值在短时间窗口内计算,采用了公开的成熟算法和最佳实践规则以避免伪差。通过将这些测量值与每个30秒片段打包,数据集使研究者能够测试仅从脉搏信号预测血压、心率或呼吸频率的算法,并探索这些目标如何共同变化。

确保信号值得信赖

真实医院数据可能很混乱:传感器脱落、患者移动、导线断开。为避免误导性分析,团队建立了信号质量流程来筛选每个片段。针对每种信号类型,他们检查了平坦线、缺失值、不合理的心率或呼吸率以及不一致的搏动形态。通过所有检查的片段被标记为高质量;存在轻微问题但仍可用的信息被标注为低质量;存在严重问题的片段则被完全排除。作者还通过将心房颤动这一关键标签与另一项研究中经专家审阅的心电图注释进行比较来验证其准确性,发现高度一致且几乎完美的特异性。

Figure 2
Figure 2.

为未来的健康算法奠定基础

通过将大规模数据、详细的心律标签、多通道同步信号和明确的质量评分相结合,MIMIC-III-Ext-PPG为数据驱动医学提供了强大的试验平台。研究者可用它对从腕式传感器检测不规则心跳、无袖带血压估计到构建同时学习多项生命体征的多任务模型等新方法进行基准测试。尽管该数据集本身并不用于指导实时医疗决策,但这一开放数据集为开发更可靠、更具泛化能力的算法奠定了基础,未来有望将日常脉搏传感器变成对严重心肺问题的早期预警系统。

引用: Moulaeifard, M., Kutscher, M., Aston, P.J. et al. MIMIC-III-Ext-PPG, a PPG-based Benchmark Dataset for Cardiovascular and Respiratory Signal Analysis. Sci Data 13, 668 (2026). https://doi.org/10.1038/s41597-026-07335-8

关键词: 光电容积描记法, 心律失常检测, 重症监护数据, 血压估算, 可穿戴健康传感器