Clear Sky Science · zh

通过辨别进行的隐性语音学习优于明确的听并记忆任务

· 返回目录

为什么记住声音很重要

我们几乎能瞬间在电话里认出亲友的声音,但很多人在记住陌生声音时会感到困难,尤其是在同时听到很多人或音质欠佳的情况下。这种能力不仅是社交上的方便:在执法、法庭和安保工作中,人们越来越常被要求从大量录音中辨认出特定说话人。本研究提出了一个看似简单但具有重大现实影响的问题:我们是在刻意努力记住新声音时学得更好,还是在专注于无意识地仔细区分声音时学得更好?

两种认识声音的途径

研究人员对比了两种类似日常的声音熟悉路径。一种是明确指示:让参与者仔细听并记住若干声音,以便稍后识别。这类似于经典实验室测试,志愿者先学习一小组录音,之后被问“你以前听过这个人吗?”另一种路径则从未提及学习。参与者进行的是同–异任务:每次试验他们听到两段非常短的语音片段,只需判断是否来自同一个人或来自两个人。参与者并不知道,这种反复比较声音的过程实际上也是一种学习机会。在每种暴露方式之后,所有人都要完成一个意外的测试:他们听单一片段并决定该声音是“旧的”(之前听过)还是“新的”。

Figure 1
Figure 1.

使任务变得简单或困难

为了查看记忆负荷如何影响结果,团队设计了两个版本的实验。在简单版本中,参与者一次学习四个声音;在困难版本中,一次学习十个。所有语音都来自精心构建的苏黎世德语语音语料库,使用的是听起来自然的短句片段,而非人造声音或孤立元音。研究者还使用现代自动说话人识别工具挑选出难度相近的一组声音,以确保两种学习方法没有不公平的优势。关键是,每个声音的总听取时间在两种条件下是匹配的:无论是记忆还是辨别,参与者听到的语音量相同,唯一不同的是任务的侧重点。

测试揭示了什么

在超过130名警校学员中,结果十分明确。在事后判断某个声音是旧还是新时,参与者在隐性辨别任务之后的表现优于在明确的听并记忆任务之后的表现。这一优势在只涉及四个声音和需要学习十个声音的情况下均成立,且不取决于辨别或记忆哪个先进行。同时,当需要学习的声音数量增加时,整体识别水平下降,证实了高“声音负荷”会显著增加任务难度。有趣的是,某人在初始辨别任务中的表现并不能强烈预测其后在识别测试中的表现,这表明当下能否区分两个声音并不等同于形成牢固的记忆来辨认是谁。

Figure 2
Figure 2.

为什么无意识的学习可能效果更好

为什么一个从不提及学习的任务会比明确要求记忆的任务产生更好的记忆?作者提出了认知负荷的概念:我们的工作记忆容量有限,刻意尝试记住若干陌生声音可能会使其超载。在辨别任务中,听者专注于一个简单的感知性决策——同一还是不同——而不会同时尝试反复复述每个人是谁。这可能释放出心理资源去编码区分说话人的细微模式。辨别情境也更接近真实对话的情形:我们通常会连续快速地听到多位说话者,而不是一次只听一个孤立的声音。

这对实验室外意味着什么

对非专业人士来说,这项研究的要点很直接:当人们忙于仔细比较声音(即便他们未意识到自己在记忆)时,比被告知坐下来有意记住每个声音要更有效地学会新声音。这对法医工作有直接启示——在困难录音中,工作人员常常需要熟悉许多说话人。依靠现实感强的辨别练习——询问两段片段是否来自同一说话人——的培训体系,可能比传统的“听并记住”训练建立更强、更可靠的语音记忆。更广泛而言,这些发现强调了大脑或许在将学习融入有趣的任务中时,能更好地学习诸如声音这样的复杂社交信号,而不是把学习视为一种独立的意志行为。

引用: Fröhlich, A., Ramon, M., French, P. et al. Implicit voice learning through discrimination outperforms explicit listen-and-memorize tasks. Sci Rep 16, 13498 (2026). https://doi.org/10.1038/s41598-026-41541-z

关键词: 语音识别, 隐性学习, 法医音频, 说话人身份, 听觉记忆