Clear Sky Science · fr

La dynamique spatiotemporelle et les sous-états sous-tendent la signalisation émotionnelle dans les mouvements du visage

2026-04-01 · Retour à l’index

Pourquoi nos visages en mouvement importent

La vie quotidienne est remplie de regards rapides, de sourcils relevés et de demi-sourires qui orientent nos interactions sociales. Pourtant, la plupart des recherches ont traité les expressions faciales comme des photographies fixes. Cette étude pose une question plus réaliste : comment les schémas mouvants de nos visages au fil du temps portent-ils une signification émotionnelle, à la fois lorsque nous sommes silencieux et lorsque nous parlons ?

Figure 1. Comment quelques schémas de mouvements faciaux de base se combinent pour exprimer différentes émotions sur des visages silencieux et pendant la parole.

Quelques schémas de mouvement essentiels

Les chercheurs ont filmé les visages de 43 volontaires exprimant la joie, la tristesse et la colère de deux façons : par des expressions silencieuses et en prononçant une phrase neutre sur un ton émotionnel. À l’aide d’une analyse faciale automatisée, ils ont suivi comment des groupes de muscles autour des yeux, des joues et de la bouche évoluaient sur des centaines de très courts instants. Ils ont ensuite employé des outils mathématiques pour condenser cette riche dynamique en un ensemble réduit de motifs de base qui réapparaissaient chez différentes personnes et émotions.

Visage supérieur, visage inférieur et signaux mixtes

Pour les expressions silencieuses, la dynamique faciale pouvait être rendue par seulement trois composantes principales : une dominée par les mouvements du haut du visage, une par ceux du bas du visage, et une qui reliait mouvements du bas et du haut. Différentes émotions résultaient de mélanges variables de ces composantes au fil du temps. La colère impliquait des changements forts et coordonnés dans les régions supérieure et inférieure. La joie reposait surtout sur des actions du bas du visage comme le sourire. La tristesse utilisait des variations plus modérées à travers les trois schémas. Quand l’équipe a entraîné un classificateur informatique sur ces signatures dynamiques, il a pu identifier l’émotion exprimée à partir du mouvement seul avec une grande précision.

Superposer l’émotion à la parole

Quand les personnes parlaient tout en exprimant une émotion, la même idée de base restait valable, mais les schémas se combinaient différemment. Les trois composantes avaient tendance à mêler les mouvements de la bouche nécessaires à la parole avec des changements de sourcils et des yeux qui signalent une émotion. Le classificateur fonctionnait toujours bien, bien que moins parfaitement que pour les expressions silencieuses, reflétant la complexité supplémentaire de jongler entre parole et affichage émotionnel. Cela suggère que nos visages réutilisent un petit jeu de blocs de mouvement, les remodelant de façon flexible pour répondre à la fois aux besoins verbaux et émotionnels.

Figure 2. Comment des phases de mouvement détendues, changeantes et maintenues s’articulent pour façonner des expressions émotionnelles distinctes au fil du temps.

Sous-phases cachées à l’intérieur de chaque expression

L’équipe a ensuite zoomé davantage sur le déroulement des expressions seconde par seconde. En regroupant les données de mouvement, elle a identifié trois « sous-états » récurrents qui traversent toutes les expressions : des périodes détendues avec peu de mouvement, des périodes de transition rapides lorsque le visage bascule vers ou hors d’une expression, et des périodes de maintien où l’expression est soutenue. Ces mini-phases différaient en vitesse et en complexité selon l’émotion et selon que la personne parlait ou non. Par exemple, les transitions étaient particulièrement rapides et distinctives pour les expressions de joie, et la séquence globale de sous-états était plus structurée dans les expressions silencieuses que pendant la parole.

Correspondance avec la perception humaine

Pour vérifier si ces motifs de faible dimension importent pour les observateurs, les chercheurs ont créé des animations simplifiées montrant uniquement des points mobiles sur le visage, en supprimant tout autre indice. Quarante-cinq nouveaux volontaires ont regardé ces animations et jugé l’émotion perçue. Les choix humains concordaient étroitement avec les prédictions du modèle, et ce même petit ensemble de schémas de mouvement suffisait à prédire les étiquettes émotionnelles des participants bien au-delà du hasard. Cela indique que émetteurs et récepteurs s’appuient sur un ensemble compact de dynamiques faciales pour émettre et lire des indices émotionnels.

Ce que cela signifie pour l’interaction quotidienne

Globalement, l’étude suggère que malgré l’apparente richesse de notre comportement facial, la signalisation émotionnelle dépend de seulement quelques schémas de mouvement essentiels et d’une poignée de courtes phases lorsque les expressions montent, se maintiennent et s’estompent. Cette structure épurée pourrait aider le cerveau à contrôler efficacement de nombreux muscles faciaux tout en transmettant des sentiments clairs, même pendant la conversation. Les résultats offrent un plan pour modéliser des expressions émotionnelles naturelles dans des domaines comme la robotique sociale et pourraient aussi aider à expliquer pourquoi certaines affections cliniques impliquent des différences subtiles mais importantes dans la communication faciale.

Citation: Cuve, H.C.J., Sowden-Carvalho, S. & Cook, J.L. Spatiotemporal dynamics and substates underlie emotional signalling in facial movements. Sci Rep 16, 15686 (2026). https://doi.org/10.1038/s41598-026-46726-0

Mots-clés: expressions faciales, reconnaissance des émotions, dynamique des mouvements faciaux, communication non verbale, parole émotive