Clear Sky Science · zh

使用来自170万人的数据预训练的多模态基础模型评估多场景与多设备的心脏健康

2026-02-24 · 返回目录

为何你的心跳数据重要

从医院的心脏监护仪到智能手表，我们的生活越来越多地通过来自心脏的微弱电学和光学信号被记录下来。这些记录能够发现危险的心律异常、在无袖带情况下估测血压，甚至提示未来的心脏风险。但由于设备与使用场景差异巨大，现有算法通常只能在它们被构建的狭窄情境中表现良好。本研究提出了一种新型的心脏信号“基础”模型，旨在同时理解来自多种设备、多个国家和多种用例的心脏健康信息。

多种聆听心脏的方式

医生和设备有多种方式来“听”心跳。经典的医院检测是12导联心电图（ECG），通过在胸部和四肢贴附电极来从不同角度记录心脏的电活动。重症监护病房常用更少的导联并配合一种称为光电容积描记（PPG）的光学传感器，该传感器通过照射皮肤来跟踪血液在血管中的搏动。在家庭环境中，智能手表和贴片可能只记录单导联ECG或仅记录PPG。这些配置产生的信号在波形、时长和通道数量上各不相同，这也使得构建通用模型变得困难。传统方法通常为每种设备和任务训练独立、定制的算法，当移至新环境或不同人群时往往表现不佳。

为多种心脏信号构建一个“大脑”

研究团队设计了一个心脏感知基础模型（CSFM），以作为这些信号的通用“大脑”。CSFM不是从单一整洁的数据集中学习，而是基于一个庞大且混杂的集合进行训练：约170万条来自多家医院和多个国家的心脏记录，包含ECG和PPG波形以及医生或机器撰写的文本报告。模型将信号切分为短片段，把信号与文字都转换为标记(token)，并输入到变换器(transformer)中——这是一类在语言和图像理解上推动近期进展的深度学习架构。在训练过程中，大量标记被故意隐藏，模型学习重建缺失部分。这种“掩码”训练促使CSFM捕获跨设备、导联和描述语言之间共享的关键模式。

从诊断到血压及更广的应用

训练完成后，CSFM可以使用相对较小的标注数据集适配到许多具体任务。团队在标准12导联ECG、可穿戴单导联ECG和来自智能手表的PPG上测试了它在心律与疾病分类方面的表现。它不仅匹配了而且常常超过了强大的任务专用深度网络。CSFM还能直接从简短的ECG和PPG片段估计年龄、性别和体质指数，表明模型学到的不仅仅是心跳本身，还有关于个体的微妙线索。在另一组实验中，模型将ECG与PPG转化为连续的血压波形，再进一步得到收缩压和舒张压值，生成的无袖带血压估计比竞争方法更为准确。

跨设备工作并填补信息空缺

一个特别重要的测试是CSFM能否应对仅能获得部分常规信息的情况。研究表明，从CSFM微调得到的模型无论看到完整的12导联、6导联、2个常用导联甚至单导联，都能表现良好。他们还测试了仅ECG、仅PPG以及ECG加PPG的输入组合。在这些配置中，基于CSFM的系统保持了稳健性，而传统模型的性能下降更明显。模型的内部表征甚至可以作为现成特征用于像梯度提升树这样简单的工具，常常达到与完全微调深度网络相近的性能。最后，通过添加回归头，CSFM可以将一种类型的信号生成成另一种——例如从PPG生成逼真的ECG，或从单导联重建完整的12导联ECG——这为数据增强和在理想记录不可得时改进分析提供了可能。

这对患者意味着什么

对非专业读者而言，核心信息是：一个通用的通用模型现在可以理解非常不同的心脏记录，并仍然提供准确且具临床价值的答案。与其为每种设备和每家医院构建脆弱的单一算法，不如采用CSFM这一共享基础，再进行少量本地化适配，从在智能手表上发现危险心律到预测哪些患者在一年内面临更高死亡风险。作者也承认仍有公开问题，例如如何让模型的决策更易被临床医生理解以及降低其算力需求。即便如此，他们的结果表明，面向心脏信号的基础模型可能有助于将先进的心脏监测和风险预测带给更多人、在更多地点，并利用人们已有的设备。

引用: Gu, X., Tang, W., Han, J. et al. Cardiac health assessment across scenarios and devices using a multimodal foundation model pretrained on data from 1.7 million individuals. Nat Mach Intell 8, 220–233 (2026). https://doi.org/10.1038/s42256-026-01180-5

关键词: 心脏基础模型, 心电图, 光电容积描记, 数字心脏学, 可穿戴心脏监测