Clear Sky Science · pt

Um banco de dados validado de emoção auditiva em mandarim de frases com pronomes pessoais do sujeito (MCAE-SPPS)

· Voltar ao índice

Por que palavras simples como “eu” e “você” importam

Frases do dia a dia, como “Eu tenho um plano” ou “Você foi bem”, carregam mais do que informação — elas carregam sentimento. Mudanças sutis em quem fala sobre quem podem moldar a forma como ouvimos e interpretamos emoção em uma voz. Este estudo apresenta uma grande biblioteca sonora cuidadosamente verificada de frases em mandarim que se concentram em pronomes pessoais como “eu”, “você” e “ele”. Ela foi projetada para ajudar cientistas, clínicos e engenheiros a entender melhor como a escolha do pronome colore as emoções que percebemos e para construir ferramentas mais inteligentes para saúde mental e comunicação humano–máquina.

Construindo uma biblioteca de vozes emocionais

Para criar esse recurso, os pesquisadores primeiro redigiram 40 frases curtas e emocionalmente neutras em mandarim, todas com um padrão simples como “Eu tenho um plano.” Eles confirmaram com avaliadores independentes que essas frases soavam neutras, e não alegres ou tristes. Em seguida, trocaram a palavra sujeito para criar seis versões de cada frase — “eu”, “nós”, “você” singular, “vocês” plural, “ele” e “eles” — mantendo o restante da frase idêntico. Isso produziu 200 frases-base neutras, cada uma diferindo apenas no pronome, de modo que quaisquer mudanças na percepção emocional pudessem ser atribuídas a essa única palavra.

Transformando frases neutras em fala emocional

Seis atores altamente treinados falantes de mandarim — três homens e três mulheres — gravaram cada frase em sete estilos emocionais: neutro, alegria, tristeza, raiva, medo, nojo e surpresa. Isso significou que cada ator produziu 1.400 gravações, totalizando 8.400 clipes. As gravações ocorreram em um estúdio profissional e foram cuidadosamente editadas e normalizadas para que a qualidade sonora fosse consistente. Após a remoção de um pequeno número de clipes com erros técnicos ou de pronúncia, permaneceram 8.379 enunciados para serem avaliados pelos ouvintes.

Figure 1
Figure 1.

Como os ouvintes avaliaram sentimentos na voz

Para descobrir o quão claramente cada clipe expressava emoção, a equipe recrutou 720 estudantes universitários chineses. Cada pessoa ouviu algumas centenas de clipes online e, para cada um, escolheu qual das sete emoções ouviu e quão intensa ela parecia em uma escala de nove pontos. Cada clipe foi julgado por 40 ouvintes diferentes, fornecendo um panorama rico de quão consistentemente as pessoas reconheciam as emoções pretendidas. Os pesquisadores então mantiveram apenas aquelas gravações que foram identificadas corretamente pelo menos três vezes mais frequentemente do que por acaso e que não eram frequentemente confundidas com outra emoção. Esse filtro de qualidade deixou 6.675 gravações “válidas”, ainda cobrindo todas as emoções e tipos de pronome.

O que os dados revelam sobre emoção e pronomes

O banco de dados final mostra que algumas emoções são muito mais fáceis de ouvir do que outras: neutro e tristeza foram reconhecidos com mais precisão, enquanto medo e nojo foram mais facilmente confundidos. Mulheres, em média, foram ligeiramente melhores que homens em identificar as emoções na fala. Crucialmente, a equipe descobriu que os pronomes importam: frases dirigidas a “você” foram distinguíveis de frases em terceira pessoa sobre “ele” ou “eles” em todas as emoções, sugerindo que falar diretamente ao ouvinte aumenta a clareza emocional. A escolha do pronome também alterou a percepção de intensidade da fala. Por exemplo, frases com “você” tenderam a soar mais intensas para raiva e medo, enquanto frases com “eu” soaram mais intensas para alegria e nojo. Análises acústicas vincularam ainda características como entonação, intensidade e qualidade vocal à precisão com que cada emoção foi reconhecida.

Figure 2
Figure 2.

Por que esse recurso é importante para o futuro

Em termos simples, este trabalho mostra que palavras minúsculas como “eu” e “você” podem mudar não apenas o que dizemos, mas quão fortemente nossos sentimentos são percebidos. Ao oferecer milhares de gravações cuidadosamente rotuladas nas quais apenas o pronome e o tom emocional variam, o Banco de Dados Auditivo de Emoção em Mandarim de Frases com Pronomes Pessoais do Sujeito dá aos pesquisadores uma ferramenta poderosa para estudar como linguagem, emoção e perspectiva social interagem. Ele pode apoiar avanços em pesquisa cerebral, inteligência artificial sensível à emoção e ferramentas clínicas que detectam mudanças de humor ou saúde mental, tudo fundamentado na questão simples, porém profunda, de quem fala sobre quem.

Citação: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z

Palavras-chave: fala emocional, mandarim, pronomes pessoais, reconhecimento de emoção, base de dados de fala