Clear Sky Science · pl

Zweryfikowana mandaryńskochińska baza dźwięków emocji zdań z zaimkami osobowymi (MCAE-SPPS)

· Powrót do spisu

Dlaczego proste słowa takie jak „ja” i „ty” mają znaczenie

Codzienne wyrażenia typu „mam plan” czy „dobrze ci poszło” niosą ze sobą coś więcej niż informację — niosą uczucie. Subtelne zmiany w tym, kto mówi o kim, mogą kształtować to, jak słyszymy i interpretujemy emocje w głosie. W tym badaniu przedstawiono dużą, starannie sprawdzoną bibliotekę dźwięków zdań w języku mandaryńskim, których centralnym elementem są zaimki osobowe takie jak „ja”, „ty” i „on”. Ma ona pomóc naukowcom, klinicystom i inżynierom lepiej zrozumieć, jak wybór zaimka wpływa na odczuwane emocje, a także stworzyć bardziej zaawansowane narzędzia dla zdrowia psychicznego i komunikacji człowiek–maszyna.

Budowanie biblioteki emocjonalnych głosów

Aby stworzyć to źródło, badacze najpierw napisali 40 krótkich, emocjonalnie neutralnych zdań po mandaryńsku, wszystkie w prostym schemacie, np. „mam plan”. Potwierdzili u niezależnych oceniających, że zdania te odbierane są jako neutralne, a nie szczęśliwe czy smutne. Następnie zamienili wyraz oznaczający podmiot, tworząc sześć wersji każdego zdania — „ja”, „my”, „ty” w liczbie pojedynczej, „wy” w liczbie mnogiej, „on” oraz „oni” — przy zachowaniu pozostałej części zdania bez zmian. Powstało w ten sposób 200 neutralnych zdań bazowych, różniących się jedynie zaimkiem, dzięki czemu wszelkie zmiany w odbiorze emocji można było przypisać temu jednemu słowu.

Przekształcanie neutralnych zdań w mowę emocjonalną

Sześciu wysoko wykwalifikowanych aktorów mówiących po mandaryńsku — trzech mężczyzn i trzy kobiety — nagrało każde zdanie w siedmiu stylach emocjonalnych: neutralnym, radości, smutku, gniewu, strachu, wstrętu i zaskoczenia. Oznaczało to, że każdy aktor wyprodukował po 1 400 nagrań, co dało w sumie 8 400 klipów. Nagrania odbyły się w profesjonalnym studiu dźwiękowym i zostały starannie zmontowane oraz znormalizowane, aby zapewnić spójność jakości dźwięku. Po usunięciu niewielkiej liczby klipów z błędami technicznymi lub wymowy pozostało 8 379 wypowiedzi do przetestowania z udziałem słuchaczy.

Figure 1
Figure 1.

Jak słuchacze oceniali uczucia w głosie

Aby sprawdzić, jak wyraźnie każdy klip przekazywał emocję, zespół zrekrutował 720 chińskich studentów. Każda osoba odsłuchiwała kilkaset klipów online i dla każdego wybierała, którą z siedmiu emocji usłyszała oraz jak silnie ją odczuwała na dziewięciopunktowej skali. Każdy klip oceniano przez 40 różnych słuchaczy, co dało bogaty obraz tego, jak konsekwentnie rozpoznawano zamierzone uczucia. Badacze zachowali następnie tylko te nagrania, które były poprawnie identyfikowane co najmniej trzy razy częściej niż przypadkowo i które nie były często mylone z inną emocją. Ten filtr jakościowy pozostawił 6 675 „ważnych” nagrań, obejmujących nadal wszystkie emocje i typy zaimków.

Co dane ujawniają o emocjach i zaimkach

Końcowa baza pokazuje, że niektóre emocje są znacznie łatwiejsze do usłyszenia niż inne: neutralność i smutek rozpoznawano najdokładniej, podczas gdy strach i wstręt częściej się myliły. Kobiety średnio były nieco lepsze od mężczyzn w identyfikacji emocji w mowie. Co istotne, zespół odkrył, że zaimki mają znaczenie: zdania skierowane do „ciebie” odróżniały się od zdań o osobach trzecich „on” lub „oni” we wszystkich emocjach, co sugeruje, że zwracanie się bezpośrednio do słuchacza zwiększa klarowność emocjonalną. Wybór zaimka zmieniał też postrzeganą intensywność mowy. Na przykład zdania z „ty” zwykle wydawały się silniejsze w przypadku gniewu i strachu, podczas gdy zdania z „ja” brzmiały bardziej intensywnie przy radości i wstręcie. Analizy akustyczne powiązały ponadto cechy takie jak wysokość tonu, głośność i jakość głosu z tym, jak trafnie rozpoznawano poszczególne emocje.

Figure 2
Figure 2.

Dlaczego to źródło ma znaczenie na przyszłość

Mówiąc prosto, praca ta pokazuje, że drobne słowa takie jak „ja” i „ty” mogą zmieniać nie tylko to, co mówimy, lecz także jak silnie słyszalne są nasze uczucia. Dzięki tysiącom starannie oznaczonych nagrań, w których zmieniają się jedynie zaimek i ton emocjonalny, Mandaryńskochińska Baza Dźwięków Emocji Zdań z Zaimkami Osobowymi daje badaczom potężne narzędzie do badania, jak język, emocje i perspektywa społeczna wzajemnie na siebie oddziałują. Może wspierać postępy w badaniach mózgu, bardziej wyczulone systemy sztucznej inteligencji rozpoznające emocje oraz kliniczne narzędzia nasłuchujące zmian nastroju czy zdrowia psychicznego — wszystko osadzone w prostej, lecz głębokiej kwestii: kto mówi o kim.

Cytowanie: Li, M., Zhou, A., Yan, H. et al. A validated Mandarin Chinese Auditory Emotion Database of Subject-Personal-Pronoun Sentences (MCAE-SPPS). Sci Data 13, 602 (2026). https://doi.org/10.1038/s41597-026-06976-z

Słowa kluczowe: mowa emocjonalna, mandaryński chiński, zaimki osobowe, rozpoznawanie emocji, baza danych mowy