Clear Sky Science · it

L'inferenza causale modella la postdizione crossmodale nell'integrazione multisensoriale

· Torna all'indice

Come luci e suoni successivi riscrivono ciò che abbiamo appena vissuto

Ricorda quando hai notato un amico che ti chiamava in mezzo alla strada affollata e improvvisamente ti sei reso conto che stava gridando da un po'. Può sembrare che la mente torni indietro nel tempo e riscriva quel che hai sentito e visto un istante prima. Questo studio esplora come il cervello combina segnali visivi e uditivi in una breve finestra temporale e mostra che luci e suoni successivi possono letteralmente cambiare ciò che crediamo di aver visto in passato.

Figure 1
Figure 1.

Un trucco strano di lampi e bip

I ricercatori si sono concentrati su due illusioni curiose chiamate “Coniglio Audiovisivo Illusorio (AV)” e “Coniglio AV Invisibile”. In queste illusioni, brevi lampi di luce su uno schermo vengono abbinati a rapidi bip da un altoparlante. Talvolta manca un lampo ma è presente un bip; altre volte c'è un lampo senza bip. Quando i lampi e i bip sono disposti in una sequenza specifica e avvengono molto vicini nel tempo, le persone segnalano con regolarità di vedere un lampo in più che non è mai apparso, o non riescono a vedere un lampo che invece c'era. Crucialmente, l'ultima coppia lampo–bip nella sequenza può cambiare la percezione di momenti precedenti, mostrando che la percezione non procede semplicemente in avanti nel tempo ma può essere modificata a posteriori.

Mettere alla prova come il cervello sceglie una singola storia

Per comprendere le regole nascoste dietro queste illusioni, il team ha presentato 28 condizioni accuratamente progettate a 28 volontari. Ai partecipanti è stato detto di ignorare i suoni e di riportare semplicemente quanti lampi avevano visto e dove erano apparsi su una fila di cinque posizioni possibili. Le sequenze di lampi potevano muoversi a sinistra o a destra o perfino cambiare direzione, e i suoni potevano essere perfettamente sincronizzati con i lampi o sfasati di circa due decimi di secondo. Questo disegno sperimentale ha ridotto strategie di semplice indovinamento e ha permesso ai ricercatori di indagare quando il cervello unisce vista e udito e quando li mantiene separati. Hanno quindi misurato quanto spesso le persone riportavano lampi illusori al centro (il “Coniglio Illusorio”) o mancavano lampi reali al centro (il “Coniglio Invisibile”).

Quando il tempo si allinea, le illusioni prendono il sopravvento

I risultati hanno mostrato che le prove illusionistiche producevano molti più lampi illusori o mancanti rispetto alle prove di controllo in cui i lampi apparivano da soli o in combinazioni audiovisive più semplici. Quando lampi e bip erano perfettamente allineati nel tempo, i partecipanti riportavano le illusioni in circa il 40% delle prove. Ma quando i suoni precedevano o seguivano i lampi di 225 millisecondi, i tassi di illusione diminuivano. Questo suggerisce che il cervello possiede una “finestra temporale multisensoriale” limitata—della durata di alcune centinaia di millisecondi—entro la quale è disposto a trattare viste e suoni come parte dello stesso evento. All'interno di questa finestra, eventi successivi possono retroattivamente modificare come vengono percepiti lampi precedenti; al di fuori di essa, il cervello è più propenso a trattare visione e udito come flussi non correlati.

Figure 2
Figure 2.

Un cervello che pesa le cause come uno statistico

Per spiegare questi risultati, gli autori hanno confrontato quattro modelli computazionali su come il cervello potrebbe combinare le informazioni sensoriali. Il modello chiave era un modello di Inferenza Causale Bayesiana (BCI), che assume che il cervello si comporti un po' come uno statistico: pesa aspettative pregresse e prove sensoriali rumorose per decidere se vista e udito provengono da una singola causa comune o da cause separate. Se una causa comune è probabile, il modello fonde lampi e bip in un unico evento, dando più peso al senso più affidabile—in questo caso i bip, netti e precisi. Tre modelli alternativi o fondevano sempre vista e suono, o li mantenevano sempre separati, oppure usavano l'inferenza causale ma ignoravano l'ultima coppia lampo–bip nel prendere la decisione e quindi non riuscivano a catturare pienamente la postdizione.

Perché la spiegazione bayesiana è la più adatta

Il modello BCI ha meglio rispecchiato il comportamento delle persone in tutte le condizioni. Ha riprodotto accuratamente gli elevati tassi di illusione nelle condizioni chiave del coniglio, i tassi più bassi nelle prove di controllo e la diminuzione delle illusioni quando lampi e bip non erano sincronizzati. È importante notare che quando i ricercatori hanno rimosso l'influenza dell'ultima coppia lampo–bip dal calcolo causale, il modello ha sistematicamente sottostimato la frequenza delle illusioni. Questo indica che il cervello non costruisce semplicemente una percezione dall'evento iniziale in avanti; invece, accumula evidenze lungo tutta la sequenza e poi decide retrospettivamente la storia più probabile. Quando l'ultima coppia lampo–bip sostiene fortemente una causa condivisa, il cervello è più disposto a “colmare” un lampo mancante o a cancellarne uno debole al centro.

Cosa significa questo per la percezione quotidiana

Nella vita di tutti i giorni, i nostri sensi sono costantemente sommersi da viste e suoni sovrapposti. Questo lavoro suggerisce che il cervello aspetta un breve momento, raccoglie informazioni da eventi passati, presenti e leggermente futuri, e poi si stabilizza su un'interpretazione coerente—talvolta a costo di accuratezza. Il quadro dell'inferenza causale bayesiana offre una spiegazione semplice: i nostri cervelli favoriscono una singola, plausibile versione di ciò che è accaduto, anche se ciò significa aggiungere o cancellare dettagli a posteriori. In altre parole, ciò che pensi di aver visto un istante fa può essere silenziosamente riscritto da quello che senti o vedi subito dopo.

Citazione: Günaydın, G., Moran, J.K., Rohe, T. et al. Causal inference shapes crossmodal postdiction in multisensory integration. Sci Rep 16, 7490 (2026). https://doi.org/10.1038/s41598-026-36884-6

Parole chiave: integrazione multisensoriale, illusione audiovisiva, inferenza causale, postdizione, percezione bayesiana