Clear Sky Science · sv

Kausal inferens formar korsmodal postdiction i multisensorisk integration

2026-02-21 · Tillbaka till index

Hur senare synintryck och ljud skriver om vad vi just upplevde

Tänk tillbaka på att du märkte en vän ropa ditt namn på en livlig gata och plötsligt insåg att de hade ropat ett tag. Det kan kännas som att sinnet går tillbaka i tiden och skriver om vad du hörde och såg för ett ögonblick sedan. Den här studien undersöker hur hjärnan kombinerar det som kommer genom ögon och öron över ett kort tidsfönster och visar att senare syn- och ljudintryck bokstavligen kan ändra vad vi tror att vi såg i det förflutna.

En märklig trick med blixtar och pip

Forskarna fokuserade på två nyfikna illusioner kallade “Illusory Audiovisual (AV) Rabbit” och “Invisible AV Rabbit.” I dessa illusioner paras korta ljusblixtar på en skärm med snabba pip från en högtalare. Ibland saknas en blixt men ett pip finns; andra gånger finns en blixt utan ett pip. När blixtarna och pipen är ordnade i en specifik sekvens och inträffar nära i tiden rapporterar människor pålitligt att de ser en extra blixt som aldrig faktiskt visades, eller att de missar en blixt som verkligen var där. Avgörande är att det sista blixt–pip-paret i sekvensen kan förändra hur människor uppfattar tidigare ögonblick, vilket visar att perception inte bara rör sig framåt i tiden utan kan redigeras i efterhand.

Testa hur hjärnan väljer en enda berättelse

För att förstå de dolda reglerna bakom dessa illusioner presenterade teamet 28 noggrant utformade villkor för 28 frivilliga. Deltagarna ombads att ignorera ljuden och helt enkelt rapportera hur många blixtar de såg och var de dök upp på en rad med fem möjliga positioner. Blixtsekvenserna kunde röra sig åt vänster eller höger eller till och med byta riktning, och ljuden kunde vara perfekt synkroniserade med blixtarna eller förskjutna med cirka två tiondels sekund. Denna design minskade enkla gissningsstrategier och gjorde det möjligt för forskarna att undersöka när hjärnan skulle kombinera syn och ljud och när den skulle hålla dem åtskilda. De mätte sedan hur ofta människor rapporterade illusoriska mittblixtar (”Illusory Rabbit”) eller missade verkliga mittblixtar (”Invisible Rabbit”).

När tidpunkten stämmer överens tar illusionerna över

Resultaten visade att illusionförsök gav långt fler illusoriska eller saknade blixtar än kontrollförsök där blixtar visades ensamma eller i enklare audiovisuella kombinationer. När blixtar och pip var perfekt tidsmässigt justerade rapporterade deltagarna illusionerna i ungefär 40 procent av försöken. Men när ljuden ledde eller släpade efter blixtarna med 225 millisekunder sjönk illusionfrekvenserna. Detta tyder på att hjärnan har ett begränsat “multisensoriskt tidsfönster” — som varar några hundra millisekunder — inom vilket den är villig att betrakta syn- och ljudintryck som en del av samma händelse. Inom detta fönster kan senare händelser retroaktivt ändra hur tidigare blixtar uppfattas; utanför det är hjärnan mer benägen att se syn och hörsel som orelaterade strömmar.

En hjärna som väger orsaker som en statistiker

För att förklara dessa fynd jämförde författarna fyra beräkningsmodeller för hur hjärnan kan kombinera sensorisk information. Nyckelmodellen var en Bayesiansk kausal inferensmodell (BCI), som antar att hjärnan beter sig lite som en statistiker: den väger tidigare förväntningar och brusig sensorisk information för att avgöra om syn och hörsel kommer från en gemensam orsak eller från separata orsaker. Om en gemensam orsak är sannolik slår modellen samman blixtar och pip till en enda händelse och ger mer vikt åt den mer tillförlitliga sinneskanalen — i detta fall de skarpa och precisa pipen. Tre alternativa modeller antingen alltid smälte ihop syn och ljud, alltid höll dem åtskilda, eller använde kausal inferens men ignorerade det sista blixt–pip-paret vid sitt beslut, och kunde därför inte fullt ut fånga postdiction.

Varför den bayesianska berättelsen passar bäst

BCI-modellen matchade människors beteende bäst över alla villkor. Den reproducerade med precision höga illusionsfrekvenser i de centrala rabbit-villkoren, lägre frekvenser i kontrollförsök och minskningen i illusioner när blixtar och pip var i otakt. Viktigt är att när forskarna tog bort påverkan från det sista blixt–pip-paret i den kausala beräkningen underskattade modellen konsekvent hur ofta illusionerna inträffade. Detta indikerar att hjärnan inte bara bygger en percept från den första händelsen framåt; istället ackumulerar den bevis över hela sekvensen och avgör därefter retrospektivt vilken berättelse som är mest sannolik. När det sista blixt–pip-paret starkt stöder en gemensam orsak är hjärnan mer benägen att ”fyll i” en saknad blixt eller radera en svag mittblixt.

Vad detta betyder för vardaglig perception

I vardagslivet är våra sinnen ständigt översvämmade av överlappande synintryck och ljud. Detta arbete tyder på att hjärnan väntar en kort stund, samlar information från förflutna, nuvarande och något framtida händelser, och sedan slår fast en sammanhängande tolkning — ibland på bekostnad av noggrannhet. Det bayesianska ramverket för kausal inferens ger en enkel förklaring: våra hjärnor föredrar en enda, rimlig berättelse om vad som hände, även om det innebär att lägga till eller radera detaljer i efterhand. Med andra ord kan det du tror att du såg för en bråkdel av en sekund sedan tyst skrivas om av vad du hör eller ser härnäst.

Citering: Günaydın, G., Moran, J.K., Rohe, T. et al. Causal inference shapes crossmodal postdiction in multisensory integration. Sci Rep 16, 7490 (2026). https://doi.org/10.1038/s41598-026-36884-6

Nyckelord: multisensorisk integration, audiovisuell illusion, kausal inferens, postdiction, Bayesiansk perception