Clear Sky Science · it
I modelli cognitivi facilitano l’inferenza in tempo reale di motivazioni latenti
Perché indovinare obiettivi nascosti è importante
Ogni giorno interpreti silenziosamente le intenzioni delle persone intorno a te—se un guidatore sta per immettersi nella tua corsia, se un ciclista si fermerà, o se un collega sta cercando di aiutare o di competere. Questi giudizi fulminei si basano sull’interpretazione di motivazioni nascoste a partire da movimenti visibili. L’intelligenza artificiale odierna può essere estremamente precisa nelle previsioni, ma spesso funziona come una “scatola nera” che non sa spiegare perché ha preso una decisione. Questo studio si chiede se i modelli psicologici del comportamento umano possano dare all’IA un senso delle motivazioni altrui più simile a quello umano, rendendola più veloce, più accurata e più facile da fidarsi.
Un semplice gioco di inseguimento e schivata
Per esplorare questo, i ricercatori hanno costruito un videogioco essenziale. In ogni turno di 10 secondi, un giocatore umano guidava una “nave” triangolare con una levetta mentre una nave controllata dal computer si muoveva secondo uno di diversi schemi. Al giocatore umano veniva assegnato segretamente uno dei tre obiettivi: Attaccare (collidere con l’altra nave), Evitare (stare lontano), o Ispezionare (restare nelle vicinanze senza collidere). La nave del computer poteva comportarsi in modo aggressivo, timoroso, curioso, difensivo o semplicemente vagare. Queste combinazioni creavano situazioni in cui i movimenti delle navi si allineavano o si scontravano—per esempio, un umano che attacca inseguendo una nave timorosa che continua a fuggire.

Misurare quanto gli umani leggono gli obiettivi nascosti
Il primo passo è stato capire quanto bene le persone stesse riescano a leggere le motivazioni dai movimenti. Il team ha preso le partite degli otto piloti migliori e ha trasformato ogni turno in un breve video. Nuovi volontari hanno guardato questi clip e dovevano indovinare l’obiettivo del giocatore umano—attaccare, evitare o ispezionare—dopo aver visto solo 1, 4, 7 o 10 secondi di movimento. In diversi gruppi, inclusi partecipanti con e senza diagnosi di autismo, le persone hanno identificato correttamente l’obiettivo in circa due terzi dei casi. L’accuratezza aumentava man mano che veniva mostrata più parte della prova, e la performance è risultata simile tra i gruppi, fornendo un solido riferimento umano per il confronto.
Un progetto psicologico per il movimento
Invece di immettere dati grezzi simili a video direttamente in una rete neurale, gli autori hanno costruito un modello cognitivo per catturare le forze che potrebbero guidare il movimento di una persona. Il loro modello di “inseguimento dell’obiettivo globale-locale” (GLOP) assume che un giocatore bilanci contemporaneamente diverse spinte: mantenere una distanza preferita dall’avversario (troppo vicino è pericoloso, troppo lontano fa perdere opportunità), restare in buone posizioni sullo schermo invece di rimanere intrappolato in un angolo, e adattare o anticipare il ritmo e la direzione dell’altra nave. Questi fattori vengono combinati in un’unica direzione “motivazionale” del movimento, con termini aggiuntivi per riflettere la fluidità dei movimenti delle persone e quanta casualità c’è nel loro controllo.

Addestrare l’IA a leggere la mente dai movimenti
Per rendere utile questo modello in tempo reale, i ricercatori hanno simulato 100.000 turni di gioco usando molte impostazioni diverse dei parametri GLOP. Hanno poi addestrato una rete neurale ricorrente a ricevere sequenze di posizioni delle navi e stimare rapidamente i parametri nascosti—come la distanza preferita o quanto una persona tiene alla posizione globale. Questa rete è riuscita a recuperare diversi parametri chiave con grande accuratezza già dopo pochi secondi di movimento. Successivamente, hanno addestrato una serie di reti classificatrici per indovinare l’obiettivo del giocatore in tre modi diversi: direttamente dai dati di posizione grezzi, da semplici statistiche riassuntive (come distanza media e avvicinamento versus allontanamento), o dai parametri inferiti dal modello cognitivo. Infine, hanno costruito classificatori “ensemble” che combinavano queste sorgenti.
Sorpassare il riferimento umano
Tutti i classificatori di IA hanno eguagliato o superato la performance umana, ma il modo in cui le informazioni venivano preparate ha fatto la differenza. Le reti che si basavano solo sul movimento grezzo o solo sui parametri del modello hanno performato in modo simile alle persone, con circa il 66% di accuratezza. I classificatori che ricevevano semplici statistiche riassuntive hanno fatto meglio, e i migliori risultati sono arrivati dalla combinazione di quelle statistiche con i parametri del modello cognitivo, raggiungendo circa il 72% di accuratezza. Questi sistemi informati dal modello si sono anche addestrati più rapidamente e in modo più stabile rispetto a quelli alimentati solo con dati grezzi. Quando l’accuratezza è stata tracciata momento per momento durante ogni turno, l’IA poteva aggiornare la sua ipotesi sull’obiettivo nascosto di un giocatore in meno del tempo tra due aggiornamenti dello schermo, inferendo efficacemente l’intento in tempo reale.
Cosa significa per l’IA quotidiana
Per un lettore non esperto, la conclusione è che integrare teoria psicologica nell’IA può aiutare le macchine a comprendere non solo cosa fanno le persone, ma perché lo fanno. Traducendo movimenti disordinati in un piccolo insieme di motivazioni interpretabili—come quanto vicino qualcuno desidera stare o come bilancia sicurezza e opportunità—il sistema diventa sia più accurato sia più facile da spiegare. In applicazioni future come le auto a guida autonoma o i team umano–IA, questo tipo di “front end cognitivo” potrebbe aiutare l’IA ad anticipare prima e con maggiore affidabilità le intenzioni degli altri agenti, prevenendo potenzialmente collisioni e malintesi offrendo al contempo spiegazioni comprensibili per gli esseri umani, ad esempio “l’altro guidatore probabilmente sta cercando di immettersi, non sta solo deviando.”
Citazione: Fitch, A.K., Kvam, P.D. Cognitive models facilitate real-time inference of latent motives. Sci Rep 16, 6444 (2026). https://doi.org/10.1038/s41598-026-37587-8
Parole chiave: teoria della mente, modellizzazione cognitiva, inferenza delle intenzioni, interazione umano–IA, IA spiegabile