Clear Sky Science · zh

听觉不匹配反应与复杂声音非谐波性之间的非线性关系

· 返回目录

为什么大脑在意混乱的声音

日常听觉充满了丰富而叠加的声音:人群中的交谈声、管弦乐队的乐器声、森林里的鸟鸣。许多这些声音是“谐波”的,意味着它们的成分以有序的方式排列,我们的耳朵和大脑可以轻松将其解释为音高。但现实中也存在更混乱、不那么有序的声音。本研究提出了一个看似简单的问题:当声音变得越发无序时,大脑在何种程度上不再可靠地察觉模式中的变化?

Figure 1
Figure 1.

有序音与混乱音

当一个复杂音是谐波的时,它的构成成分——纯频率——会以单一基频的整数倍整齐排列,我们听到的是音高。在“非谐波”音中,这些成分被随机偏移,产生更混沌的声音。谐波声音在噪声中更容易被分辨和记住,而高度非谐波的声音会使音高辨别变得很困难。作者在此基础上,通过逐步向合成声音添加不同量的随机“抖动”,在从完全谐波到强烈非谐波之间创建了一条平滑的连续范围,然后考察大脑的自动变化检测系统在该范围内的反应如何变化。

作为背景听觉

研究者用脑电图(EEG)记录了35名志愿者在被动听序列短音时的大脑活动。采用“游移”设计,音调在一段时间内保持不变,然后突然跳到一个新值。每次跳变后的第一个音会违反听者的预期,通常会触发一种称为不匹配负波(MMN)的脑电信号,随后出现的P3a反映了自动的注意转移。关键在于,音量和声音的一般构成被保持一致;唯一区别是内部频率模式的规则性——即非谐波程度——在条件间系统性变化。

大脑警报突然消失的地方

来自流行“预测处理”理论的一个预测是,随着声音变得更难预测(更非谐波),大脑应稳步降低其误差信号,从而导致MMN幅度呈平滑、近似线性的下降。相反,数据讲述了不同的故事。MMN幅度在谐波和轻微非谐波的声音中相似,只有在非谐波程度越过某一阈值后才急剧下降。统计建模表明,S形(sigmoid)曲线比线性或较为灵活的多项式模型更能描述这种关系。转折点出现在中等抖动条件之间,恰好对应声音的内部结构被搅乱到听觉系统无法可靠提取明确音高的程度。

自动注意的最佳区间

后期的P3a反应表现出不同的模式。它并非随着非谐波程度简单缩小,而是呈倒U形:在非常有序的声音中较小,在中等非谐波水平达到峰值,然后在最混乱的音中再次下降。这表明,当音高变化仍然勉强可被检测但已经需要更多计算资源时,大脑的自动注意系统最强烈地被调动。一个单独的行为学实验中,志愿者需要主动判断第二个音是比第一个音更高还是更低,结果指向了相似的阈值:音高辨别在大约与MMN开始崩溃的非谐波水平处变得不可靠。

Figure 2
Figure 2.

这对我们听觉的意义

综合来看,研究结果表明,大脑的早期变化检测系统在处理谐波和轻度失真声音时方式相似,但一旦声音的内部结构变得过于不规则,大脑就无法再可靠地建立稳定的音高表征——其对音高变化的自动“警报”实际上会关闭。这种阈值式行为与我们的听觉系统依赖从复杂声音中提取单一基调以形成感知的观点一致,当这一任务变得不可能时系统便受挫。与此同时,由于一些更渐进的模型也比无效应模型更好地拟合数据,结果并不排除大脑预测机制中较微妙的精度加权形式。相反,本研究为随着声音频谱无序性增加,脑中不匹配反应的突变提供了清晰的描述性图谱,有助于定位有序听觉向感知混淆转变的界限。

引用: Brzezińska, A., Witkowski, B., Basińska, M. et al. Non-linear relationships between auditory mismatch responses and the inharmonicity of complex sounds. Sci Rep 16, 11836 (2026). https://doi.org/10.1038/s41598-026-41129-7

关键词: 听觉感知, 音高, 谐波性, 不匹配负波, 预测处理