Clear Sky Science · ru

Проверенная звуковая база эмоциональной речи на путунхуа с предложениями, содержащими личные местоимения (MCAE-SPPS)

· Назад к списку

Почему простые слова вроде «я» и «ты» имеют значение

Повседневные фразы, такие как «у меня есть план» или «ты хорошо справился», несут не только информацию — они передают ощущение. Тонкие изменения в том, кто говорит о ком, могут влиять на то, как мы воспринимаем эмоции в голосе. В этом исследовании представлена большая, тщательно проверенная звуковая библиотека предложений на путунхуа, все они сосредоточены на личных местоимениях вроде «я», «ты» и «он». База данных создана, чтобы помочь ученым, клиницистам и инженерам лучше понять, как выбор местоимения окрашивает воспринимаемые эмоции, и для разработки более совершенных инструментов в области психического здоровья и взаимодействия человек–машина.

Создание библиотеки эмоциональных голосов

Для создания этого ресурса исследователи сначала составили 40 коротких предложений на путунхуа с эмоционально нейтральным содержанием, все с простой структурой, например «у меня есть план». Они подтвердили с помощью независимых оценщиков, что эти предложения воспринимаются как нейтральные, а не как счастливые или грустные. Затем они меняли слово-субъект, создав по шесть вариантов каждого предложения — «я», «мы», «ты» (единственное), «вы» (множественное), «он» и «они» — при этом остальная часть предложения оставалась идентичной. В результате получилось 200 нейтральных базовых предложений, каждое из которых отличалось только местоимением, так что любые изменения в восприятии эмоции можно было связать с этой единственной словоформой.

Преобразование нейтральных предложений в эмоциональную речь

Шесть высококвалифицированных носителей путунхуа — три мужчины и три женщины — записали каждое предложение в семи эмоциональных вариантах: нейтральный, радость, печаль, гнев, страх, отвращение и удивление. Это означало, что каждый актёр произвёл по 1 400 записей, всего — 8 400 фрагментов. Записи проводились в профессиональной звукозаписывающей студии и были аккуратно отредактированы и нормализованы, чтобы обеспечить единообразие качества звука. После исключения небольшого числа клипов с техническими или произносительными ошибками осталось 8 379 высказываний для тестирования слушателями.

Figure 1
Figure 1.

Как слушатели оценивали эмоциональную окраску голоса

Чтобы выяснить, насколько ясно каждый клип передаёт эмоцию, команда привлекла 720 китайских студентов вузов. Каждый участник прослушал несколько сотен клипов онлайн и для каждого выбрал одну из семи эмоций, которую он услышал, а также оценил её силу по девятибальной шкале. Каждый клип оценивали 40 разных слушателей, что дало богатую картину того, насколько последовательно люди распознавали заданные эмоции. Исследователи затем отобрали только те записи, которые правильно идентиковались по крайней мере в три раза чаще, чем по случайности, и которые не путали часто с другой эмоцией. После такого качественного фильтра осталось 6 675 «валидных» записей, по-прежнему охватывающих все эмоции и типы местоимений.

Что данные показывают об эмоциях и местоимениях

Итоговая база данных показывает, что некоторые эмоции распознаются гораздо легче, чем другие: нейтральную и печаль определяли наиболее точно, в то время как страх и отвращение чаще путали между собой. В среднем женщины немного лучше мужчин справлялись с идентификацией эмоций в речи. Важно, что команда обнаружила: местоимения имеют значение — предложения, обращённые к «тебе/вам», отличались от предложений в третьем лице о «нём» или «них» во всех эмоциях, что свидетельствует о том, что прямое обращение к слушателю повышает эмоциональную ясность. Выбор местоимения также изменял восприятие интенсивности речи. Например, предложения с «ты/вы» обычно воспринимались как более интенсивные при гневе и страхе, тогда как предложения с «я» казались сильнее при радости и отвращении. Акустический анализ дополнительно связал такие характеристики, как высота тона, громкость и качество голоса, с тем, насколько точно распознавалась каждая эмоция.

Figure 2
Figure 2.

Почему этот ресурс важен в дальнейшем

Проще говоря, эта работа показывает, что крошечные слова вроде «я» и «ты» могут менять не только то, что мы говорим, но и то, насколько сильно наши чувства воспринимаются. Предоставляя тысячи тщательно размеченных записей, в которых варьируются лишь местоимение и эмоциональная интонация, база данных MCAE-SPPS на путунхуа даёт исследователям мощный инструмент для изучения взаимодействия языка, эмоций и социальной перспективы. Она может поддержать достижения в исследованиях мозга, развитие более чувствительного эмоционально-осведомлённого ИИ и клинические инструменты для мониторинга изменений настроения или психического здоровья, — всё это основывается на простом, но глубоком вопросе: кто говорит о ком.

Цитирование: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z

Ключевые слова: эмоциональная речь, путунхуа, личные местоимения, распознавание эмоций, речевая база данных