Clear Sky Science · zh
经验证的普通话第一人称与第二人称代词句子听觉情感数据库(MCAE-SPPS)
为什么像“我”和“你”这样简单的词很重要
日常短语如“我有个计划”或“你做得很好”不仅传递信息——它们也传达情感。关于谁在谈论谁的细微变化,会影响我们听到并解读语音中的情感。本研究推出了一个大型、经过严格校验的普通话句子音频库,所有句子都以“我”“你”“他”等人称代词为核心。该数据库旨在帮助科学家、临床医生和工程师更好地理解代词选择如何影响我们感知到的情绪,并用于构建更智能的心理健康与人机通信工具。
构建情感声音库
为创建此资源,研究人员首先撰写了40句简短且情感中性的普通话句子,均采用类似“我有个计划”的简单模式。他们通过独立评分者确认这些句子在情感上确实偏中性而非快乐或悲伤。随后,他们将主语词替换成六种版本——“我”、“我们”、“你”(单数),“你们”(复数)、“他”和“他们”,其余句子内容保持不变。由此生成了200条中性基础句子,每条仅在人称代词上有所不同,从而使任何情感感知的差异都可归因于该单一词项。
将中性句子转为情感语音
六位受过高度训练的普通话演员——三名男性和三名女性——以七种情感风格录制了每句句子:中性、快乐、悲伤、愤怒、恐惧、厌恶和惊讶。每位演员因此录制了1,400段音频,总计8,400段。录音在专业录音室完成,并经过精细编辑与归一化处理,以保证音质一致。在剔除少数存在技术或发音问题的片段后,保留了8,379段语音用于听众测试。

听众如何判断语音中的情感
为评估每段音频情感表达的清晰度,研究团队招募了720名中国大学生。每位参与者在线听取数百段片段,并对每段选择他们听到的七种情感之一,同时在九点量表上评定情感强度。每段音频由40名不同听众判定,提供了关于人们对目标情感识别一致性的丰富资料。研究人员随后仅保留那些被正确识别频率至少高于机率三倍且不常被误判为其他情感的录音。经过这一质量筛选后,得到6,675段“有效”录音,仍涵盖所有情感与代词类型。
数据揭示的情感与代词关系
最终数据库显示,某些情感比其他情感更容易被分辨:中性和悲伤的识别率最高,而恐惧与厌恶则更易混淆。总体来看,女性识别语音中情感的能力略优于男性。关键发现是,人称代词具有影响力:面向“你”的句子在所有情感类别中都能与表述“他”或“他们”的第三人称句子区分开来,表明直接称呼听者会增强情感的清晰度。代词选择也改变了语句的感觉强度,例如,“你”句在愤怒和恐惧中往往感觉更强烈,而“我”句在快乐和厌恶中则显得更强。声学分析进一步将基频、响度和声质等特征与每种情感的识别准确性联系起来。

此资源未来的重要意义
简单来说,这项工作表明像“我”“你”这样的小词不仅改变我们说什么,也改变我们的情感被听到的强度。通过提供数千条仅在代词和情感语调上有差异且有精确标签的录音,普通话第一人称与第二人称代词句子听觉情感数据库为研究语言、情感与社会视角如何交互提供了强有力的工具。它可支持脑科学研究、更加敏感的情感感知人工智能,以及用于检测情绪或心理健康变化的临床工具,所有这些都基于一个简单而深刻的问题:谁在谈论谁。
引用: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z
关键词: 情感语音, 普通话, 人称代词, 情感识别, 语音数据库