Clear Sky Science · it

Dinamiche spazio-temporali e sottostati sottendono la segnalazione emotiva nei movimenti facciali

2026-04-01 · Torna all'indice

Perché i nostri volti in movimento contano

La vita quotidiana è piena di sguardi rapidi, sopracciglia alzate e mezzi sorrisi che orientano i nostri rapporti sociali. Eppure la maggior parte delle ricerche ha trattato le espressioni facciali come fotografie statiche. Questo studio pone una domanda più realistica: in che modo i pattern di movimento del volto nel tempo trasmettono significato emotivo, sia quando siamo in silenzio sia quando parliamo?

Figure 1. Come pochi schemi di movimento facciale di base si combinano per esprimere emozioni diverse nei volti silenziosi e durante il parlato.

Alcuni schemi di movimento fondamentali

I ricercatori hanno registrato i volti di 43 volontari mentre esprimevano felicità, tristezza e rabbia in due modalità: con espressioni silenziose e mentre pronunciavano una frase neutra con tono emotivo. Tramite analisi facciale automatizzata hanno tracciato come gruppi di muscoli intorno agli occhi, alle guance e alla bocca cambiassero in centinaia di piccoli intervalli temporali. Hanno poi utilizzato strumenti matematici per condensare questo ricco movimento in un numero ridotto di schemi di base che ricomparivano ripetutamente tra persone ed emozioni.

Volto superiore, volto inferiore e segnali misti

Per le espressioni silenziose, le dinamiche facciali potevano essere spiegate con appena tre componenti principali: una dominata dai movimenti della parte superiore del volto, una dalla parte inferiore e una che collegava movimenti inferiori e superiori. Diverse emozioni emergevano da diverse combinazioni temporali di queste componenti. La rabbia comportava cambiamenti forti e coordinati in entrambe le regioni superiore e inferiore. La felicità faceva maggiormente affidamento su azioni della parte inferiore del volto, come il sorriso. La tristezza utilizzava cambiamenti più moderati attraverso tutti e tre gli schemi. Quando il team ha addestrato un classificatore su queste firme dinamiche, questo è riuscito a riconoscere quale emozione venisse espressa solo dal movimento con elevata accuratezza.

Combinare l’emozione con il parlato

Quando le persone parlavano esprimendo un’emozione, lo stesso principio di base rimaneva, ma gli schemi si mescolavano in modo diverso. Le tre componenti tendevano ora a combinare i movimenti della bocca necessari per il parlato con i cambiamenti di sopracciglia e occhi che segnalano il sentimento. Il classificatore continuava a performare bene, sebbene non in modo perfetto come per le espressioni silenziose, riflettendo la complessità aggiuntiva di gestire contemporaneamente parlare ed esprimere emozioni. Questo suggerisce che i nostri volti riutilizzano un piccolo insieme di mattoni di movimento, rimodellandoli con flessibilità per adattarsi sia alle esigenze verbali sia a quelle emotive.

Figure 2. Come fasi di movimento facciale rilassate, di transizione e sostenute lavorano insieme per modellare espressioni emotive distinte nel tempo.

Mini-fasi nascoste all’interno di ogni espressione

Il gruppo ha poi approfondito come le espressioni si svolgono secondo secondi. Clusterizzando i dati di movimento, hanno individuato tre “sottostati” ricorrenti che attraversano tutte le espressioni: periodi rilassati con poco movimento, fasi di transizione rapide mentre il volto passa dentro o fuori da un’espressione, e periodi sostenuti in cui l’espressione è tenuta. Queste mini-fasi differivano per velocità e complessità a seconda dell’emozione e del fatto che la persona stesse parlando. Per esempio, le transizioni erano particolarmente veloci e distintive nelle espressioni di felicità, e la sequenza complessiva di sottostati risultava più strutturata nelle espressioni silenziose rispetto al parlato.

Concordanza con la percezione umana

Per verificare se questi schemi a bassa dimensionalità fossero effettivamente importanti per gli osservatori, i ricercatori hanno creato animazioni semplificate che mostravano solo punti in movimento sul volto, eliminando tutti gli altri indizi. Quarantacinque nuovi volontari hanno guardato queste animazioni e giudicato quale emozione vedevano. Le scelte umane si sono allineate strettamente con le previsioni del modello, e lo stesso piccolo insieme di schemi di movimento è stato sufficiente a prevedere le etichette emotive degli osservatori a tassi ben al di sopra del caso. Ciò indica che sia chi invia che chi riceve si affidano a un compatto insieme di dinamiche facciali quando danno e leggono segnali emotivi.

Implicazioni per l’interazione quotidiana

Nel complesso, lo studio suggerisce che nonostante la apparente ricchezza del nostro comportamento facciale, la segnalazione emotiva dipende da pochi schemi di movimento fondamentali e da un numero limitato di brevi fasi mentre le espressioni emergono, si mantengono e svaniscono. Questa struttura snella potrebbe aiutare il cervello a controllare molti muscoli facciali in modo efficiente pur trasmettendo sentimenti chiari, anche durante la conversazione. I risultati forniscono un modello per riprodurre espressioni emotive naturali in ambiti come la robotica sociale e potrebbero anche contribuire a spiegare perché alcune condizioni cliniche comportano differenze sottili ma importanti nella comunicazione facciale.

Citazione: Cuve, H.C.J., Sowden-Carvalho, S. & Cook, J.L. Spatiotemporal dynamics and substates underlie emotional signalling in facial movements. Sci Rep 16, 15686 (2026). https://doi.org/10.1038/s41598-026-46726-0

Parole chiave: espressioni facciali, riconoscimento delle emozioni, dinamiche del movimento facciale, comunicazione non verbale, parlato emotivo