Clear Sky Science · sv
En validerad mandarin-kinesisk ljuddatabas för känslor med subjekt-personliga-pronomenmeningar (MCAE-SPPS)
Varför enkla ord som ”jag” och ”du” spelar roll
Vardagliga fraser som ”jag har en plan” eller ”du gjorde bra ifrån dig” förmedlar mer än bara information — de bär känsla. Subtila förändringar i vem som talar om vem kan forma hur vi uppfattar och tolkar känslor i en röst. Denna studie presenterar ett stort, noggrant kontrollerat ljudbibliotek med mandarinmeningar som alla kretsar kring personliga pronomen som ”jag”, ”du” och ”han”. Det är utformat för att hjälpa forskare, kliniker och ingenjörer att bättre förstå hur våra val av pronomen färgar de känslor vi hör, samt för att bygga smartare verktyg för mental hälsa och människa–maskin-kommunikation.
Att bygga ett bibliotek av emotionella röster
För att skapa denna resurs skrev forskarna först 40 korta, känslomässigt neutrala meningar på mandarin, alla med ett enkelt mönster som ”jag har en plan”. De bekräftade med oberoende bedömare att dessa meningar uppfattades som neutrala snarare än glada eller ledsna. Därefter bytte de ut subjektet för att skapa sex versioner av varje mening — ”jag”, ”vi”, singular ”du”, plural ”du”, ”han” och ”de” — medan resten av meningen förblev identisk. Detta gav 200 neutrala basmeningar, där varje skiljde sig endast i pronomenet, så att eventuella förändringar i hur människor uppfattade känslor kunde spåras tillbaka till just det ordet.
Att förvandla neutrala meningar till emotionellt tal
Sju högutbildade mandarin-talande skådespelare — tre män och tre kvinnor — spelade in varje mening i sju emotionella stilar: neutral, glädje, ledsenhet, ilska, rädsla, avsmak och överraskning. Det innebar att varje skådespelare producerade 1 400 inspelningar, totalt 8 400 klipp. Inspelningarna gjordes i en professionell ljudstudio och redigerades och normaliserades noggrant så att ljudkvaliteten var konsekvent. Efter att ett litet antal klipp med tekniska eller uttalsfel tagits bort återstod 8 379 uttalanden för testning med lyssnare.

Hur lyssnarna bedömde känslor i rösten
För att ta reda på hur tydligt varje klipp uttryckte känsla rekryterade teamet 720 kinesiska universitetsstudenter. Varje person lyssnade på några hundra klipp online och valde för varje klipp vilket av de sju känslotillstånden de hörde och hur starkt det kändes på en nio-gradig skala. Varje klipp bedömdes av 40 olika lyssnare, vilket gav en rik bild av hur konsekvent människor kände igen de avsedda känslorna. Forskarna behöll sedan bara de inspelningar som identifierades korrekt minst tre gånger oftare än slumpen och som inte ofta förväxlades med en annan känsla. Detta kvalitetsfilter lämnade 6 675 ”giltiga” inspelningar, fortfarande täckande alla känslor och pronomenstyper.
Vad data avslöjar om känsla och pronomen
Den slutliga databasen visar att vissa känslor är mycket lättare att höra än andra: neutral och ledsen identifierades mest korrekt, medan rädsla och avsmak lättare förväxlades. Kvinnor var i genomsnitt något bättre än män på att identifiera känslor i tal. Avgörande visade teamet att pronomen spelar roll: meningar som riktade sig till ”du” särskilde sig från tredjepersonsmeningar om ”han” eller ”de” över alla känslor, vilket tyder på att direkt tilltal av lyssnaren ökar känslans tydlighet. Pronomenval förändrade också hur intensivt talet uppfattades. Till exempel tenderade ”du”-meningar att upplevas som starkare för ilska och rädsla, medan ”jag”-meningar kändes mer intensiva för glädje och avsmak. Akustiska analyser kopplade dessutom egenskaper som tonhöjd, ljudstyrka och röstkvalitet till hur korrekt varje känsla igenkändes.

Varför denna resurs är viktig framöver
Kort sagt visar detta arbete att små ord som ”jag” och ”du” kan förändra inte bara vad vi säger utan också hur starkt våra känslor hörs. Genom att erbjuda tusentals noggrant märkta inspelningar där endast pronomenet och den emotionella tonen varierar ger Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences forskare ett kraftfullt verktyg för att studera hur språk, känsla och socialt perspektiv samverkar. Det kan stödja framsteg inom hjärnforskning, mer känsliga känslo-medvetna AI-system och kliniska verktyg som lyssnar efter förändringar i humör eller mental hälsa — allt förankrat i den enkla men djupgående frågan vem som talar om vem.
Citering: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z
Nyckelord: emotionellt tal, mandarin, personliga pronomen, känsloigenkänning, taldatabas