Clear Sky Science · zh

元音时长的感知边界:合成阿拉伯语元音的感知研究

· 返回目录

为什么语音中短暂的时间片段很重要

当我们听别人说阿拉伯语时,往往不会注意每个元音持续了多长时间。然而,时长的细微差别可以完全改变一个词的意思——类似于英语中“bit”和“beat”之间的区别。本文提出了一个看似简单的问题:阿拉伯语两大主要方言的母语听者需要元音持续多长时间,才会把它听为“长元音”而不是“短元音”?通过回答这个问题,研究揭示了我们的听觉如何把连续的声音切分成语言的基本构件。

Figure 1
Figure 1.

能改变意义的短元音与长元音

阿拉伯语把元音长短作为其音系的重要组成部分:像 /a/ 与更长的 /aː/ 这样的对立可以区分完全不同的词。以前的研究测量了人们说话时这些元音通常有多长,发现长元音通常约为短元音的1.5到3倍左右。但那些研究侧重于元音的产生,而非听者如何感知。本文把问题反过来:在元音时长逐渐增加的过程中,听者在何处从把它听作短元音切换为听作长元音——不同阿拉伯方言的听者在这一切换点上是否相同?

两种方言在显微镜下

研究者比较了来自纳吉迪阿拉伯语(Najdi,沙特中部)和开罗阿拉伯语(Cairene,开罗主导方言)的听者。两种变体都共享相同的三个短元音 /a, i, u/ 和三个长元音 /aː, iː, uː/。为了仅聚焦于时长因素,研究使用了精心编辑的三个最小对词的录音(例如,一个短元音词意为“他写”,对应的长元音词意为“他通信”)。研究者从自然状态下的长元音出发,以小步长逐渐压缩其持续时间,使用能在缩短元音时保持音高和音质的软件。这产生了从明显的长元音到明显的短元音的平滑序列,而不引入不自然的瑕疵。

聆听并在两个词间做出选择

四十名成年参与者——二十名纳吉迪说话者和二十名开罗说话者——完成了一项在线聆听任务。在简短熟悉原始未处理词对的阶段后,每位参与者逐一听到被操纵的版本。对于每一项,他们必须判断所听到的是长元音的词还是短元音的词。回答前可以重放声音,但一旦提交便不能更改。研究者使用考虑单词与个体听者差异的统计模型,绘制出随着元音以毫秒为单位变长,“长”判断概率如何上升的曲线。

听者在时间上在哪里划界

结果表明,时长对三种元音都是强有力的线索,但短长元音之间的精确边界取决于元音类型与方言。对于高前元音 [i],开罗听者在较短的持续时间(约84毫秒)就开始把元音听为长,而纳吉迪听者通常需约96毫秒才会切换为“长”。开罗听者在时长尺度上的判断变化也更为陡峭,表明边界更为类范畴性。对于低元音 [a],两组在时间边界上几乎完全一致,接近101毫秒,尽管开罗听者同样表现出更陡峭、更果断的转变。对于后元音 [u],两个方言的边界非常接近——纳吉迪约100毫秒,开罗约110毫秒——且该小差异在统计上不具有显著性。

Figure 2
Figure 2.

这对语音感知告诉我们什么

对外行人来说,这些几十毫秒似乎微不足道,但它们揭示了我们的听觉对本方言声音模式的高度敏感。研究显示,纳吉迪和开罗说话者在将元音标记为长所需的一般时长上达成共识,尤其是对 [a] 和 [u],但他们在 [i] 上对时长的校准有所不同。研究还表明个体存在差异:有些听者将短到长的变化视为尖锐的跳变,另一些则视为更渐进的过渡。总体而言,这些发现支持这样一种观点:语音类别并非僵硬、普遍适用的盒子;相反,我们对特定方言的接触经验会塑造大脑用来将流动的声音流转化为有意义词汇的具体时间阈值。

引用: Alfaifi, A. Perceptual boundary of vowel quantity: a perceptual study of synthesized Arabic vowels. Humanit Soc Sci Commun 13, 271 (2026). https://doi.org/10.1057/s41599-025-06454-8

关键词: 阿拉伯语元音, 元音长短, 语音感知, 方言差异, 语音学