Clear Sky Science · zh
MEETI:来自 MIMIC‑IV‑ECG 的多模态心电图数据集,含信号、图像、特征与解读
为何这对心脏健康与日常护理至关重要
每年,数以百万计的人会记录下心脏的电活动,这些呈波形的记录称为心电图(ECG)。这些检测帮助医生发现危险的心律失常及其他心脏疾病,但解读它们既耗时又需要多年的培训。与此同时,人工智能在读取X光片和摘要医疗记录等任务上取得了显著进展,但在心电图领域的进展相对较慢。本文介绍了 MEETI——一种新的心电图数据集形式,它将同一次心脏检测的多种视角汇聚在一起:信号、图像、数值和解释,使计算机能以对医生和患者都能理解的方式“理解”心电图。

对心跳的全方位一体化视图
传统的心电图库通常只提供一种信息:要么是原始电信号,要么是看起来像方格纸的心电图图像,或是一份简短的书面报告。MEETI(全称 MIMIC‑IV‑Ext ECG‑Text‑Image)是首个将四种要素为每次心电图精心对齐的大型公开资源:来自 12 导联的原始 10 秒信号、模拟医院打印输出的高分辨率图像、一组精确的逐搏测量值,以及由现代语言模型生成的详细书面解读。所有这些基于美国某大型医疗中心的 MIMIC‑IV‑ECG 集合构建,覆盖超过 16 万名患者的 75 万多次心电图记录。通过共享标识符将这些部分关联起来,MEETI 将每次心电图变成了关于心脏活动的丰富、多层次肖像。
团队如何将信号转化为丰富的数据
为了构建 MEETI,作者首先下载并检查了大约 80 万份心电图记录,确保每一份都已适当匿名化且技术上可靠。使用开源工具,他们将每个 12 导联信号渲染为标准临床布局的高分辨率图像,保留了心脏病学家依赖的细节。接着,他们将每份心电图输入 FeatureDB 工具包,该工具能自动检测每次心跳中熟悉的 P 波、QRS 和 T 波段。由此,系统计算出关键测量值,例如心率、搏动间隔、心电不同成分的时长,以及各波形的高低等。这些数值对每个导联的每一次搏动都进行了存储,从而在 10 秒内提供了异常详细的心跳行为视图。
教会语言模型谈论心律
简短的人工书写心电图报告常常含糊,未能充分阐明诊断如何与示波器上的可测量特征相关联。为弥补这一点,团队为最先进的语言模型设计了精心的提示,使其能生成长期的、以临床为基础的解读。对于每次心电图,模型既接收原始临床医师报告,也接收提取出的参数——例如多次搏动间 QRS 时长序列——并被指示在保持对专家结论忠实的同时,把这些测量作为证据纳入论述。心脏病学专家参与了该流程的设计与审阅,并在样本病例上确认生成的解释在捕捉与原始报告相同发现的同时,融入了具体的数值。结果是一段将图形目视所见与客观、可复现测量值连接起来的文字说明。
资源包含内容及其用途
MEETI 的组织方式便于研究人员从患者文件夹导航到其所有检查,再从每次检查定位到相应的图像、信号、逐搏参数和语言模型解读。整个数据集的汇总统计显示,关键测量值(如平均搏动间隔或 QRS 复合波时长)落在预期的临床范围内且几乎没有缺失值,强调了数据集的质量与完整性。作者提供了用于加载数据、读取图像和文本的示例代码,并将用于参数提取与图像生成的所有脚本作为开源工具发布。该结构允许科学家训练联合分析波形、图像与语言的模型,并探讨从自动心律分类到为实习人员与患者生成易理解报告等多种问题。

这对未来以心脏为中心的智能 AI 有何意义
作者总结认为,MEETI 消除了构建有用且值得信赖的心电图 AI 的一项关键瓶颈。通过在单一公开资源中结合原始信号、临床风格图像、细粒度测量与丰富解释,该数据集使得训练不仅能对示波图标注“正常”或“异常”的系统成为可能。相反,未来的模型可以被要求推理具体波形变化如何支持某一诊断,或展示哪些搏动和导联驱动了其结论。对患者而言,这最终可能意味着更清晰的报告和更早发现微妙问题;对临床医生而言,它提供了不仅能达到专家水平且能解释自身结论的工具。简而言之,MEETI 为下一代能够同时观察、测量并解释心跳的心脏专属 AI 奠定了基础。
引用: Zhang, D., Lan, X., Geng, S. et al. MEETI: A Multimodal ECG Dataset from MIMIC-IV-ECG with Signals, Images, Features and Interpretations. Sci Data 13, 527 (2026). https://doi.org/10.1038/s41597-026-06796-1
关键词: 心电图 数据集, 多模态 医学人工智能, 心血管 诊断, 心电图 解读, 医学 机器学习