Clear Sky Science · zh

使用基于基频和时长的特征表征中风影响的语音

· 返回目录

为什么中风会改变声音的听感

当一个人发生中风时,医生首先关注的是挽救脑组织和恢复肢体运动。但一个最为私人的损失往往出现在后期:他们熟悉且清晰的声音。该研究提出了一个简单却有力的问题——我们能否以一种可测量的方式捕捉这些语音变化,从而更好地检测、理解并最终监测与中风相关的损伤?

听基频与时长,而不仅仅是词语

我们的耳朵不仅解码词语,还会追踪语言的“旋律”与节奏,即韵律。塑造这种声音模式的两个基本要素是:音高(声音的高低)和时长(声段持续多久以及从一个音到另一个音的转换速度)。研究人员将注意力集中在这两方面,比较中风患者与健康说话者的语音差异。为此,他们在印度一家病房中建立了专门的语音数据库,记录了50名中风患者和50名以泰卢固语为母语的健康志愿者的五个延长元音和简短的三词句子。

Figure 1
Figure 1.

捕捉声音中隐藏的“音乐”

为追踪基频,团队采用了一种细粒度的方法,按声带振动的每个周期跟踪,而不是在多个周期上取平均。这使他们能够构建出实时的细致基频轮廓,即便在嘈杂的病房环境中也能获得清晰的变化图。从这些轮廓中,他们测量了简单的统计量,如平均音高、中位音高以及音高围绕中心的抖动程度。将中风患者与健康说话者相比时,出现了一个显著且与性别相关的模式:男性中风患者的典型音高往往略高于健康男性,而女性中风患者的典型音高则明显低于健康女性。这些差异在完整数据集以及经过严格年龄匹配的子组中都足够显著。

测量声音间的滑动

语音并非一连串稳定的音符。我们的发音器官在从一个音向下一个音移动时会经过短暂的“过渡”区,发音器官形状快速变化;也有相对稳定的“稳态”区,在那里单个音被较为恒定地维持。研究人员开发了自动化测量方法,通过追踪声学指纹如何从瞬间到瞬间快速变化来识别这两类区域。在健康说话者中,过渡段与稳态段较为平衡。然而,在中风患者中,模式发生了改变:音间的过渡总体更短,但这些短暂时刻的变化更为突兀,而两者之间的稳态部分则显著延长。

这些模式如何解释含糊不清的发音

将这些发现综合起来,勾勒出中风如何重塑说话方式的图景。许多患者存在一侧肢体的无力或部分瘫痪,这会使嘴唇、舌头和下颌等肌肉更难以顺滑控制。研究结果表明,构音器官可能不是平缓地在各个位置之间滑动,而是在一个位置停留得稍长,然后更突然地移动,从而产生更短、更强烈的过渡和延长的稳态段。这些更长的稳态段与听者描述的“含糊”或拖长的语音感受相吻合。

Figure 2
Figure 2.

从仔细倾听走向临床工具

对非专业听者来说,主要结论是:中风不仅削弱了语音,还在声音的音高与节律上留下了可测量的指纹。男性和女性患者在典型音高上显示相反的变化,所有中风患者在研究中均倾向于表现为更短、更尖锐的音间过渡以及更长的持续段。由于这些模式可以用简单的数值特征捕捉,它们有望为未来基于计算机的工具提供支撑,帮助临床医生更早检测中风相关语音问题、随时间追踪康复情况,甚至仅凭声音估算中风严重程度。简言之,通过将细致的聆听转化为数据,这项研究朝着把一个人声音作为了解其脑健康的实用窗口迈出了一步。

引用: Jyothi, M.V.S., Banerjee, O., Govind, D. et al. Characterizing stroke-affected speech using F0 and duration-based features. Sci Rep 16, 9146 (2026). https://doi.org/10.1038/s41598-026-40155-9

关键词: 中风语音, 构音障碍, 语音分析, 语音韵律, 临床语音数据库