Clear Sky Science · zh
验证自动化5 mL稀液吞咽声分割以估算基于音频的咽部清除时间
为何吞咽声很重要
吞咽是大多数人视为理所当然的动作,但对数以百万计的人——尤其是老年人和患有神经系统疾病者——来说,吞咽可能既困难又危险。当吞咽出现问题时,食物或液体可能进入肺部,导致营养不良、窒息或像肺炎这样严重的感染。目前诊断吞咽问题的最佳方法依赖于医院内的X光视频。本研究探讨一种更简单的方案:通过放置在颈部的小型电子听诊器监听吞咽声,并使用计算机算法来判断每次吞咽时咽部清除液体的效果。
从医院X光到智能床旁工具
当前检查吞咽的金标准是吞咽造影(videofluoroscopic swallowing study),这是一种显示含对比剂液体从口腔流经咽喉的X光动态影像。它能揭示液体通过关键结构的速度与安全性,以及是否有残留。然而,这项检查需要特殊设备和受过训练的人员,并且会使病人暴露于放射线,因此难以频繁重复或在床旁或家中进行。相比之下,颈部听诊——监听咽喉发出的声音——可以在任何地方完成,但传统上具有主观性,依赖临床人员的听觉。随着数字传感器和信号处理技术的进步,作者们试图将这些声音转化为可靠的数值指标,以反映X光所见的情况。

捕捉一次吞咽的声音
研究团队在日本的一家医院对45名已在进行疑似吞咽障碍X光检查并能安全吞咽5毫升稀液的患者进行了研究。在每名患者吞咽时,他们在颈前佩戴了一个颈部电子听诊器。相同的视频摄像机同时记录了X光屏幕和声音信号,从而实现精确同步。基于规则的计算机算法在短时间片中监测声音流的响度,标记活动爆发的开始和结束。这两点之间的时间——称为基于音频的咽部清除时间——被视为咽部主动将液体输送通过的时间间隔。
将声音事件与真实咽部运动匹配
为了判断基于声音的时序是否真实反映了吞咽的物理动作,一位经验丰富的言语语言病理学家逐帧查看了X光视频。他们标记了三个关键时刻:液体首次接触舌根后方的瓣状会厌、上食管括约肌(通向食管的闸门)打开的时刻,以及再次关闭的时刻。上述这些标志共同定义了液体通过咽部的持续时间。研究人员随后将这些X光时间点与计算机基于声音的起止点在84次吞咽中的表现进行了比较。算法成功检测到了其中的80次,并且在大多数情况下,声音区间与X光定义的咽部通过期高度重合。
时序匹配得有多好?
在96%的吞咽中,基于声音的起始发生在液体到达会厌之后,通常在约半秒内,这表明算法并非被口腔的早期运动触发,而是对咽部事件敏感。基于声音的结束通常发生在上食管括约肌关闭之后,这意味着捕获的声音区间覆盖了咽部输送的全部主动阶段。平均而言,基于音频测得的清除时间约为0.7秒,与从X光标志测得的0.79秒持续时间非常接近。重要的是,即便在那些在主要吞咽前有少量口腔液体漏入咽部(即口腔封闭不良)患者中,这一基于声音的时序仍保持稳定;相较之下,X光测得的时间在这些情况下会变长。这表明声音方法侧重于咽部的核心动作,而不易被早期被动滴流所干扰。

这对日常护理意味着什么
对患者和临床医生而言,关键讯息是:一个简单的颈部传感器加上自动分割算法,能够提供对吞咽一小口稀液时咽部清除效率的可靠估计。虽然它不能捕捉吞咽的所有阶段,并且在严重口腔控制问题者中可能低估总吞咽时间,但它能紧密跟踪对安全清除物质至关重要的咽部阶段。这为可在床旁或家庭中反复进行、不需X光或专家解读的筛查铺平了道路。经过进一步验证,这类基于音频的测量有望支持更早发现吞咽功能下降、指导治疗并帮助预防误吸性肺炎等并发症——通过将吞咽的隐秘声音转化为可用的健康信息。
引用: Jayatilake, D., Teramoto, Y., Ueno, T. et al. Validation of automated 5 mL thin liquid swallowing sound segmentation for estimating audio-derived pharyngeal clearance time. Sci Rep 16, 11908 (2026). https://doi.org/10.1038/s41598-026-39699-7
关键词: 吞咽困难, 吞咽声, 可穿戴传感器, 咽部清除时间, 数字健康