Clear Sky Science · pl

Przestrzenno‑czasowa dynamika i podstany leżą u podstaw sygnalizacji emocji w ruchach twarzy

2026-04-01 · Powrót do spisu

Dlaczego ruch naszych twarzy ma znaczenie

Codzienne życie pełne jest krótkich spojrzeń, uniesionych brwi i półuśmiechów, które kierują naszym światem społecznym. Jednak większość badań traktowała wyrazy twarzy jak fotografie. To badanie stawia bardziej realistyczne pytanie: jak ruchome wzorce twarzy w czasie niosą znaczenie emocjonalne, zarówno gdy jesteśmy w ciszy, jak i gdy mówimy?

Figure 1. W jaki sposób kilka podstawowych wzorców ruchu twarzy łączy się, by wyrażać różne emocje w twarzach bez dźwięku oraz podczas mówienia.

Kilkа podstawowych wzorców ruchu

Naukowcy zarejestrowali twarze 43 ochotników wyrażających radość, smutek i złość na dwa sposoby: jako bezdźwięczne ekspresje oraz podczas wypowiadania neutralnego zdania w emocjonalnym tonie. Przy użyciu automatycznej analizy twarzy śledzili, jak grupy mięśni wokół oczu, policzków i ust zmieniały się w setkach drobnych kroków czasowych. Następnie zastosowali narzędzia matematyczne, by skondensować ten bogaty ruch do mniejszego zestawu podstawowych wzorców, które powtarzały się u różnych osób i w różnych emocjach.

Górna twarz, dolna twarz i sygnały mieszane

Dla bezdźwięcznych ekspresji dynamikę twarzy można było wyjaśnić za pomocą zaledwie trzech głównych składowych: jednej zdominowanej przez ruchy górnej części twarzy, drugiej przez dolną część twarzy oraz trzeciej łączącej ruchy dolne i górne. Różne emocje wyłaniały się z odmiennych mieszanin tych składowych w czasie. Złość wiązała się z silnymi, skoordynowanymi zmianami w obu regionach. Radość opierała się głównie na działaniach dolnej części twarzy, takich jak uśmiech. Smutek wykorzystywał umiarkowane przesunięcia we wszystkich trzech wzorcach. Gdy zespół wytrenował klasyfikator komputerowy na tych dynamicznych sygnaturach, potrafił on z dużą dokładnością rozpoznać, która emocja była wyrażana samą tylko dynamiką ruchu.

Nakładanie emocji na mowę

Gdy ludzie mówili, wyrażając emocję, ta sama podstawowa idea pozostawała słuszna, lecz wzorce mieszały się inaczej. Trzy składowe zaczęły łączyć ruchy ust niezbędne do mowy z ruchami brwi i oczu sygnalizującymi uczucie. Klasyfikator wciąż sprawdzał się dobrze, choć nie tak idealnie jak dla bezdźwięcznych ekspresji, co odzwierciedla dodatkową złożoność łączenia mówienia i ekspresji emocjonalnej. Sugeruje to, że nasze twarze ponownie wykorzystują niewielki zestaw bloków konstrukcyjnych ruchu, elastycznie przekształcając je, by jednocześnie spełniać potrzeby werbalne i emocjonalne.

Figure 2. W jaki sposób fazy rozluźnienia, zmiany i utrzymania ruchu twarzy współdziałają, by kształtować odrębne wyrazy emocjonalne w czasie.

Ukryte mini‑fazy w każdej ekspresji

Zespół przyjrzał się następnie bliżej temu, jak ekspresje rozwijają się sekundę po sekundzie. Poprzez grupowanie danych ruchu znaleźli trzy powtarzające się „podstany”, które przecinały wszystkie ekspresje: okresy rozluźnienia z niewielkim ruchem, szybkie okresy przejściowe, gdy twarz przechodzi w ekspresję lub z niej wychodzi, oraz okresy utrzymania, kiedy ekspresja jest podtrzymywana. Te mini‑fazy różniły się prędkością i złożonością w zależności od emocji i od tego, czy osoba mówiła. Na przykład przejścia były szczególnie szybkie i charakterystyczne dla wyrażeń radosnych, a ogólna sekwencja podstan była bardziej uporządkowana w ekspresjach bezdźwięcznych niż podczas mowy.

Dopasowanie do ludzkiego postrzegania

Aby sprawdzić, czy te niskowymiarowe wzorce naprawdę mają znaczenie dla obserwatorów, badacze stworzyli uproszczone animacje pokazujące jedynie poruszające się kropki na twarzy, usuwając wszystkie inne wskazówki. Czterdziestu pięciu nowych ochotników obejrzało te animacje i oceniali, jaką emocję widzą. Wybory ludzi pokrywały się ściśle z przewidywaniami modelu, a ten sam niewielki zestaw wzorców ruchu wystarczał, by przewidzieć etykiety emocji nadmiernie lepiej niż losowo. Wskazuje to, że zarówno nadawcy, jak i odbiorcy polegają na zwartej grupie dynamiki twarzy przy nadawaniu i odczytywaniu sygnałów emocjonalnych.

Co to oznacza dla codziennej interakcji

Podsumowując, badanie sugeruje, że mimo pozornej bogatości naszego zachowania twarzy, sygnalizacja emocjonalna zależy od zaledwie kilku podstawowych wzorców ruchu i kilku krótkich faz, gdy ekspresje narastają, utrzymują się i zanikają. Ta uproszczona struktura może pomóc mózgowi efektywnie kontrolować wiele mięśni twarzy, jednocześnie przekazując wyraźne uczucia, nawet podczas rozmowy. Wyniki oferują schemat do modelowania naturalnych ekspresji emocjonalnych w takich dziedzinach jak robotyka społeczna i mogą również pomóc wyjaśnić, dlaczego niektóre stany kliniczne wiążą się z subtelnymi, lecz istotnymi różnicami w komunikacji twarzą.

Cytowanie: Cuve, H.C.J., Sowden-Carvalho, S. & Cook, J.L. Spatiotemporal dynamics and substates underlie emotional signalling in facial movements. Sci Rep 16, 15686 (2026). https://doi.org/10.1038/s41598-026-46726-0

Słowa kluczowe: wyrazy twarzy, rozpoznawanie emocji, dynamika ruchu twarzy, komunikacja niewerbalna, emocjonalna mowa