Clear Sky Science · zh

基于深度学习的连续记录肠鸣声事件检测

2026-03-30 · 返回目录

以全新方式倾听肠道

医生长期以来通过将听诊器贴在腹部来判断肠道功能，但那些短暂且主观的听诊往往错过数小时内发生的大部分情况。这项研究展示了现代人工智能如何将微弱的肠鸣声转化为消化活动的连续、客观信号。通过训练一个紧凑的深度学习系统识别长音频记录中微小的声事件，这项工作指向了可穿戴设备的可能性——像今天的心率或睡眠追踪器那样在后台静默监测肠道健康。

肠鸣声为何重要

肠鸣音不仅仅是随机的咕噜声——它们反映了肠道中肌肉与液体的运动情况。连续的非侵入性聆听可用于术后消化追踪、监测脆弱的新生儿或早期提示疾病，且无需抽血或放射检查。然而，直到最近，研究者仍缺乏大规模、注释完善的数据集和稳健的算法。许多以往系统要么对噪声过于敏感，要么仅限于短时剪辑，或者只关注极短时间片段内是否存在声音，而非整晚记录中的整体情况。

构建可靠的声音库

本研究依赖于一个公开可用的数据集，该数据集由19名志愿者在夜间用腹部接触式麦克风采集。音频被切分为短片段，并由胃肠病学专家标注为若干种肠鸣音、非肠道噪声和静默。分析前，对录音进行了细致清理：抑制安静的背景部分、标准化响度，并将声音转换为展示不同频率随时间能量分布的时频图。这一转换使系统在保留肠道活动关键模式的同时，使数据更均一，更易于计算机学习。

两只“耳朵”听不同音色

该工作的一个核心思想是肠鸣声在低频与高频上表现不同，因此作者设计模型同时用两只专门的“耳朵”去听。转换后的音频被分为低频带，捕捉较长且平滑的隆隆声，和高频带，捕捉短促、清晰的咔嗒与爆发声。每个频带分别输入其自身的处理通道，这些通道由轻量级一维卷积层组成，负责在短时间跨度和稍长时间间隔上寻找模式。随后，一个注意力机制决定在每个时刻各频带应赋予多少权重，然后将它们合并为单一的概率，表示在极短时间框架内是否存在肠鸣声事件。

从微小瞬间到整夜判定

该系统首先对极短的时间片段给出判定，但真正的临床问题往往是整段录音是否包含肠道活动以及检测随时间的稳定性。为弥合这一差距，研究者对逐帧概率进行平滑以去除孤立的故障，然后采用一个简单规则：如果录音中的任一帧具有足够高的肠鸣声概率，则将整个文件标记为包含事件。这种“时间上的最大值”策略大幅降低了偶发误判的影响，同时保留了对短暂但真实声音的敏感性。

系统的表现如何

在两种不同的数据划分（训练集与测试集）方式下，模型都展现出显著高的性能。在最小时间片上，它能在98%以上的情况下正确区分肠鸣声事件与静默或其他噪声，在捕捉真实事件与避免误报之间保持良好平衡。当决策聚合到整段录音水平时，准确率超过99.8%，意味着系统几乎不误判文件中是否存在肠道活动。这些结果超越了在相同数据集上测试的几种先前深度学习方法，尽管肠鸣声在录音总体时间中只占很小一部分。

对日常护理的意义

对非专业人士而言，结论是计算机现在可以在长时间段内以令人瞩目的可靠性倾听肠道，从嘈杂的背景噪声中提取有意义的事件。该方法目前尚不能区分不同疾病或患者群体；它仅回答肠道活动是否存在以及何时发生。但这个稳固的基础为智能腰带、贴片或衬衫等设备打开了大门，这些设备可以实时跟踪消化情况，帮助医生监测康复或支持慢性肠道疾病的居家管理，全部通过静静地倾听身体的内部声响实现。

引用: Çelik, Y. Deep learning-based detection of bowel sound events in continuous recordings. Sci Rep 16, 10595 (2026). https://doi.org/10.1038/s41598-026-47018-3

关键词: 肠鸣音, 深度学习, 胃肠监测, 医学声学, 可穿戴健康