Clear Sky Science · zh

MM-GradCAM：一种结合 1D 与 2D 心电图数据以改进多模态 GradCAM 的心律失常检测方法

2026-02-09 · 返回目录

这项心脏研究与你为何相关

心跳不规则，称为心律失常，可能导致晕厥、中风或猝死，但通常在为时已晚之前并无明显预警。医生依靠心电图（ECG）——那些熟悉的刺状线条记录心脏活动——来发现问题。近年来，计算机程序在读取这些波形方面表现优异，有时可与专家匹敌。但它们通常像一个封闭的黑箱：给出结果却不展示其推理过程。本研究提出了一种新方法，使这些强大工具更透明，帮助医生明确知道患者心电图的哪些部分影响了计算机的判断。

揭开黑箱

许多现代医疗人工智能系统采用深度学习，这种技术通过自动发现数据中的模式而不是依赖手工规则。尽管这通常提高了准确性，但也掩盖了推理过程——当生命攸关时这是一个严重问题。为建立信任，研究人员转向“可解释人工智能”方法，这些方法高亮图像或信号中对模型判断影响最大的区域。最广泛使用的工具之一是 Grad-CAM，它生成热图——以颜色覆盖显示算法注意力所在位置。然而到目前为止，这类解释通常仅限于一种输入形式，例如原始心电信号或图像，而不是同时解释两者。

同一心跳的两种视角

在这项工作中，作者聚焦于单个常用的心电通道——II 导联，数据来自一个包含一万多名患者的大型公开数据库。每段 10 秒的记录以两种不同方式处理。首先，保留其原始一维形式，即随时间变化的电压曲线。其次，将其转换为灰度图像——本质上是绘制并保存为图片的心电图条。针对每种形式，团队构建了基于 17 层卷积神经网络的对应深度学习模型，这是一种常用于模式识别的架构。一个网络从 1D 信号中学习，另一个从 2D 图像中学习，两个网络均被训练用于将心律分类为四类：正常节律、缓慢节律、快速节律组以及与房颤相关的节律。

将两种解释合为一种

训练完成后，研究者分别对基于信号和基于图像的模型应用 Grad-CAM。对于 1D 模型，他们在心电曲线上生成了彩色片段，标出网络最关注的区域。对于图像模型，他们生成了在心电图图片中突出热点的热图。新方法称为 MM-GradCAM（多模态 Grad-CAM），它将这两种视图在时间和空间上对齐并融合成单一解释。这个统一的图在一条合并的心电图条上同时展示驱动 AI 决策的时序线索和基于图像的模式。心脏病学专家审阅了大量示例，将高亮区域与不同节律的已知特征进行对比，例如房颤中 P 波缺失或某些快速节律中高度规则的快速波形。

系统读心跳的能力如何

在未见过的测试患者上，基于图像的模型正确分类节律的准确率约为 97%，而基于信号的模型约为 93%。不同节律类型的表现各不相同，图像模型总体上表现更好，尤其是在更复杂或更微妙的模式上。与此同时，融合后的 MM-GradCAM 地图显示每种视角各有贡献。在一些房颤患者中，基于信号的解释未能标出关键区域，而基于图像的热图正确聚焦于缺乏正常波形的区段。在其他情况下，例如某些快速节律，基于信号的图示提供了更清晰、更具临床意义的图景。通过将两者并列，MM-GradCAM 揭示了仅用一种输入形式无法看到的优点与局限。

这对未来心脏护理的意义

这项研究的主要信息不仅是计算机能够准确识别异常心律——许多系统已经能做到这一点——而是其推理过程现在可以向人类专家变得更可理解。通过将基于信号和基于图像的解释合并为一个连贯视图，MM-GradCAM 为心脏病专家提供了一种检查 AI 是否在“看”与医学意义相关的心电图部分的手段。这可以提高信任度，有助于发现错误，甚至作为培训学员识别复杂节律的教学工具。尽管该方法仍需在更多样化的患者群体和实际临床流程中进一步测试，但它指向了这样一个未来：强大的 AI 工具不仅给出答案，还清晰地展示其推理过程。

引用: Murat Duranay, F., Murat, E., Yıldırım, Ö. et al. MM-GradCAM: an improved multimodal GradCAM method with 1D and 2D ECG data for detection of cardiac arrhythmia. Sci Rep 16, 7919 (2026). https://doi.org/10.1038/s41598-026-38654-w

关键词: 心律失常, 心电图, 深度学习, 可解释人工智能, Grad-CAM