Clear Sky Science · zh

使用 SimCardioNet 的混合学习框架用于自动多类心电图分类

2026-02-06 · 返回目录

为什么让计算机读懂心跳很重要

每当医生开具心电图（ECG）检查时，得到的是一条曲线，这条曲线可以揭示心肌梗死、危险的心律失常以及疾病的早期迹象。但要正确解读这些波形需要多年的训练，而在许多医院——尤其是在资源匮乏的地区——心脏病专家严重不足。本研究提出了 SimCardioNet，一种新的人工智能系统，旨在自动且准确地阅读心电图图像，即使只有少量专家标注的数据也能发挥作用。通过先从未标注的心电图中学习，然后用适量的标注示例进行微调，SimCardioNet 旨在将可靠且快速的心电图解读更接近日常临床实践。

从纸质打印到智能模式识别

在许多诊所，心电图并非以干净的数字信号形式存储，而是以扫描图像或纸质打印件的形式存在。SimCardioNet 设计为直接处理这些图像。系统首先将每张心电图图片标准化为固定大小，并应用多种细微变换——小幅旋转、色彩偏移、裁剪和翻转——以模拟心电图打印或扫描时的真实世界差异。这些“增强”版本帮助模型对医院与设备之间的差异具有鲁棒性，使其学会关注心脏的电学模式，而不是诸如网格颜色或页面布局等表面细节。

一种两步式的模型训练方法

作者没有让计算机一开始就直接做诊断，而是采用了两步学习过程。第一步称为自监督学习，模型会看到大量未标注的心电图图像，并被要求识别两种不同视图是否来源于同一底层心电图。它通过一种称为对比学习的方法来实现：来自同一心跳的图像对在内部表征空间中被拉近，而来自不同患者的图像对则被推远。SimCardioNet 使用了定制的卷积层堆栈（图像处理中的标准深度学习模块）、有助于深层网络训练的残差连接，以及一个多头注意力模块，帮助模型聚焦于每个波形中最有信息量的部分。

微调系统以识别心脏疾病

经过这种“无监督”的练习阶段后，模型已经学会了心电图的丰富特征。在第二步的监督微调中，它会被提供带标签的示例——由专家标注为正常、心肌梗死、心律异常或既往心肌梗死历史的心电图，在一个更大的数据库中还有若干更广泛的疾病类别。作者逐步“解冻”网络层，先仅训练最终几层，然后允许更早的层进行调整。这种谨慎的训练计划有助于保留从未标注数据中学到的有用模式，同时将其适配到具体的诊断任务。最终的分类模块将每张心电图图像分配到若干具有临床意义的类别之一。

在实践中效果如何？

团队在三个独立的图像集合上测试了 SimCardioNet。在来自巴基斯坦医院的四类数据集中，系统正确分类了约 97.5% 的心电图，并且精确率和召回率同样很高——意味着很少漏诊，也很少误报。在一个外部 Kaggle 数据集中，它在测试集中达到了完美分数，这表明其学到的特征能很好地迁移到新来源，尽管作者也提醒说这种完美的结果有时可能反映了任务本身更简单。在 PTB-XL 这个包含五个广泛诊断组的大型基准数据集上，模型达到了约 92% 的准确率和 F1 分数，优于若干近期的深度学习方法，包括专门的卷积和循环网络。可视化工具如 Grad-CAM 显示，模型通常基于具有临床意义的波形区域做出决策，例如尖锐的 QRS 峰和 ST 段，尽管作者也发现并提出了解决偶发“捷径”问题的方法，例如模型有时会关注页面页眉。

这对患者和临床医生意味着什么

对非专业人士而言，主要结论是 SimCardioNet 展示了如何在不依赖大量昂贵且耗时的完全标注数据集的情况下，训练出能准确解读心电图的机器。通过先从未标注的心电图图像中学习通用结构，然后用较小的标注集细化该知识，系统在保持相对高效和可解释的同时，实现了可靠的多类诊断。尽管在不同医院、设备和患者群体中还需更多测试，才能在常规护理中放心使用，此项工作表明，自动心电图解读器未来有望加快病人分诊、支援负担过重的临床医生，并将在心脏病专家稀缺的地区扩展专家级的心脏评估能力。

引用: Majid, M.D., Anwar, M., Bilal, S.F. et al. A hybrid learning framework for automated multiclass electrocardiogram classification with SimCardioNet. Sci Rep 16, 7621 (2026). https://doi.org/10.1038/s41598-026-36932-1

关键词: 心电图, 深度学习, 自监督学习, 心血管疾病, 医学影像