Clear Sky Science · zh

推进心血管筛查:基于深度学习的心音分类,结合SMOTE与时间建模

· 返回目录

以新方式倾听心音

心脏病是全球头号杀手,然而在许多诊所里,主要的筛查工具仍然是医生的耳朵和一支简单的听诊器。微弱的“呼呼”声,即杂音,可以预示危险的心脏瓣膜问题,但它们很容易被忽视,尤其是在非专科中心。本文探讨了计算机如何分析记录的心音以更准确、更一致地发现杂音,从而有望把专家级的筛查能力带到人满为患的诊所和资源匮乏的环境中。

为何心音重要

每一次心跳都会产生丰富的声学信息,随着瓣膜关闭和血流通过,形成独特的声音特征。医生通过多年训练学会解读这些声音,但即便是有经验的临床医生也可能出现分歧,而基层医疗医生常常会错过重要线索。与此同时,心血管疾病每年导致数百万人死亡,许多死亡本可通过更早的发现来避免。数字化麦克风现在可以轻松记录心音,但要把这些波形转化为可靠诊断,需要能应对噪声、患者差异以及罕见但关键的异常模式的智能算法。

把原始心跳变成有用模式

研究者构建了一个逐步的管道,模拟专家的听诊过程,但具备机器的精确度。首先,他们自动检测关键的心跳事件——主要的“lub‑dub”峰值——并将录音切成以这些点为中心的短一秒片段,从而保留心动周期的自然节奏。接着,他们使用一种最初受人类听觉启发的方法,将每个片段转换为关于音高和音色的紧凑描述。研究团队不是把原始声音直接输入模型,而是用这些提炼后的模式作为输入,这使计算机更容易关注正常与杂音之间在医学上有意义的差异。

Figure 1
Figure 1.

平衡罕见杂音与随时间学习

在真实诊所中,健康心脏的录音远比严重问题的录音常见。如果计算机主要从正常心跳中学习,可能会倾向于把所有样本都标为正常,从而在纸面上仍显得准确。为避免这一陷阱,团队使用了一种生成精心合成的罕见杂音样本的技术,均衡训练集而不直接复制数据。同样重要的是,他们采用了一类擅长处理时间序列的神经网络,使系统能够关注心跳过程中声音如何随时间演变,而不是把每一时刻孤立看待。这些选择共同使模型既对异常敏感,又能抵抗噪声和患者间的变异性。

公平测试与避免隐蔽捷径

医学人工智能中常见的问题是“数据泄露”,即同一位患者的录音不小心同时影响了训练和测试,从而使性能看起来不真实地好。作者正面应对此问题:在一个数据集中按录音级别拆分数据,在另一个数据集中按患者级别拆分,确保同一人的任何片段不会同时出现在训练和测试集中。他们在两个大型公开心音集合上评估系统,这两个数据集在杂音出现频率和录音多样性方面各不相同。在两者上,该模型都能在约100例中正确区分约99例的正常与异常心音,漏诊和误报都很少。对数据进行多种重洗的额外检验显示,这一强劲表现是稳定的,而非某一次幸运划分的偶然结果。

Figure 2
Figure 2.

这对日常护理可能意味着什么

研究表明,精心设计的听诊算法在自动检测杂音方面能匹敌或超越许多早期方法,即便在更严格、更现实的测试规则下亦然。通过尊重心跳的自然时序、平衡罕见但关键的病例,并防范数据中的隐蔽捷径,作者展示了面向未来数字听诊器的一个稳健蓝图。尽管仍需更多工作以应对嘈杂的真实环境并让系统的决策对医生更易解释,这一框架指向了这样一个未来:一个小型传感器加上智能模型,能够帮助基层诊所及早发现危险的心脏问题,不论患者身处何地。

引用: Ameen, A., Eldesouky Fattoh, I., Abd El-Hafeez, T. et al. Advancing cardiovascular screening: deep learning-based heart-sound classification using SMOTE and temporal modeling. Sci Rep 16, 12063 (2026). https://doi.org/10.1038/s41598-026-45276-9

关键词: 心脏杂音, 数字听诊器, 深度学习, 心血管筛查, 心音分析