Clear Sky Science · pl

Wnioskowanie przyczynowe kształtuje postdykcję międzymodalną w integracji wielozmysłowej

2026-02-21 · Powrót do spisu

Jak późniejsze obrazy i dźwięki przepisują to, czego właśnie doświadczyliśmy

Przypomnij sobie sytuację, gdy na ruchliwej ulicy dostrzegasz przyjaciela, który woła twoje imię, i nagle uświadamiasz sobie, że krzyczał już od jakiegoś czasu. Może się wydawać, że umysł cofa się w czasie i przepisuje to, co usłyszałeś i zobaczyłeś chwilę wcześniej. Badanie to analizuje, jak mózg łączy informacje wzrokowe i słuchowe w krótkim oknie czasowym i pokazuje, że późniejsze obrazy i dźwięki mogą dosłownie zmienić to, co uważamy, że widzieliśmy w przeszłości.

Dziwny trik z błyskami i piknięciami

Naukowcy skupili się na dwóch ciekawych iluzjach zwanych „Iluzorycznym Królikiem Audiowizualnym (AV)” i „Niewidzialnym Królikiem AV”. W tych iluzjach krótkie błyski światła na ekranie łączone są z szybkim piknięciem z głośnika. Czasami błysk jest nieobecny, ale słychać piknięcie; innym razem jest błysk bez dźwięku. Kiedy błyski i piknięcia są ułożone w określoną sekwencję i występują blisko siebie w czasie, ludzie z dużą pewnością zgłaszają widzenie dodatkowego błysku, który nigdy się nie pojawił, lub nie dostrzegają błysku, który rzeczywiście był obecny. Kluczowe jest to, że ostatnia para błysk–piknięcie w sekwencji może zmienić sposób, w jaki ludzie postrzegają wcześniejsze momenty, co pokazuje, że percepcja nie przesuwa się po prostu liniowo w czasie, lecz może być edytowana po fakcie.

Sprawdzanie, jak mózg wybiera jedną spójną historię

Aby zrozumieć ukryte zasady stojące za tymi iluzjami, zespół zaprezentował 28 starannie zaprojektowanych warunków 28 ochotnikom. Uczestnikom kazano ignorować dźwięki i jedynie zgłaszać, ile błysków widzieli i gdzie pojawiły się na rzędzie z pięcioma możliwymi pozycjami. Sekwencje błysków mogły poruszać się w lewo lub w prawo, a nawet zmieniać kierunek, a dźwięki mogły być idealnie zsynchronizowane z błyskami lub przesunięte o około dwie dziesiąte sekundy. Projekt ten ograniczał proste strategie zgadywania i pozwalał badaczom badać, kiedy mózg łączy wzrok i słuch, a kiedy traktuje je oddzielnie. Następnie zmierzono, jak często ludzie zgłaszali iluzoryczne środkowe błyski ("Iluzoryczny Królik") lub pomijali rzeczywiste środkowe błyski ("Niewidzialny Królik").

Kiedy czas się zgadza, dominują iluzje

Wyniki wykazały, że w próbach iluzorycznych występowało znacznie więcej iluzorycznych lub brakujących błysków niż w próbach kontrolnych, w których błyski pojawiały się same lub w prostszych kombinacjach audiowizualnych. Gdy błyski i piknięcia były idealnie wyrównane w czasie, uczestnicy zgłaszali iluzje w około 40 procentach prób. Jednak gdy dźwięki wyprzedzały lub opóźniały się względem błysków o 225 milisekund, częstość występowania iluzji spadała. Sugeruje to, że mózg ma ograniczone „wielozmysłowe okno czasowe” — trwające kilkaset milisekund — w którym skłonny jest traktować wzrok i słuch jako część tego samego zdarzenia. W obrębie tego okna późniejsze zdarzenia mogą retroaktywnie zmieniać sposób postrzegania wcześniejszych błysków; poza nim mózg częściej traktuje wzrok i słuch jako niepowiązane strumienie informacji.

Mózg, który waży przyczyny jak statystyk

Aby wyjaśnić te wyniki, autorzy porównali cztery modele obliczeniowe opisujące, jak mózg może łączyć informacje sensoryczne. Kluczowy model to bayesowski model wnioskowania przyczynowego (BCI), który zakłada, że mózg zachowuje się trochę jak statystyk: waży uprzednie oczekiwania i zaszumione dowody sensoryczne, by zdecydować, czy wzrok i słuch pochodzą z jednego wspólnego źródła, czy z oddzielnych przyczyn. Jeśli wspólna przyczyna jest prawdopodobna, model łączy błyski i piknięcia w jedno zdarzenie, dając większą wagę bardziej wiarygodnemu zmysłowi — w tym przypadku ostrym i precyzyjnym piknięciom. Trzy alternatywne modele albo zawsze scalały wzrok i słuch, albo zawsze je rozdzielały, albo stosowały wnioskowanie przyczynowe, lecz ignorowały ostatnią parę błysk–piknięcie przy podejmowaniu decyzji, i w związku z tym nie potrafiły w pełni uchwycić postdykcji.

Dlaczego bayesowska interpretacja pasuje najlepiej

Model BCI najlepiej odzwierciedlał zachowanie ludzi we wszystkich warunkach. Dokładnie odtworzył wysokie wskaźniki iluzji w kluczowych warunkach z królikiem, niższe wskaźniki w próbach kontrolnych oraz spadek iluzji, gdy błyski i piknięcia były niesynchroniczne. Co ważne, gdy badacze usunęli wpływ ostatniej pary błysk–piknięcie z obliczeń przyczynowych, model systematycznie niedoszacowywał, jak często występowały iluzje. Wskazuje to, że mózg nie buduje percepcji jedynie od pierwszego zdarzenia naprzód; zamiast tego kumuluje dowody w całej sekwencji, a następnie retrospektywnie wybiera najbardziej prawdopodobny ciąg zdarzeń. Gdy ostatnia para błysk–piknięcie silnie wspiera jedną wspólną przyczynę, mózg chętniej „uzupełnia” brakujący błysk lub usuwa słaby błysk ze środka.

Co to oznacza dla codziennej percepcji

W codziennym życiu nasze zmysły są nieustannie zalewane nakładającymi się obrazami i dźwiękami. Praca ta sugeruje, że mózg czeka krótką chwilę, zbiera informacje z przeszłych, bieżących i nieco przyszłych zdarzeń, a następnie ustala spójną interpretację — czasem kosztem dokładności. Ramy bayesowskiego wnioskowania przyczynowego dostarczają prostej odpowiedzi: nasze mózgi preferują jedną, prawdopodobną wersję tego, co się wydarzyło, nawet jeśli oznacza to dodanie lub skreślenie szczegółów po fakcie. Innymi słowy, to, co myślisz, że widziałeś ułamek sekundy temu, może zostać cicho przepisane przez to, co usłyszysz lub zobaczysz dalej.

Cytowanie: Günaydın, G., Moran, J.K., Rohe, T. et al. Causal inference shapes crossmodal postdiction in multisensory integration. Sci Rep 16, 7490 (2026). https://doi.org/10.1038/s41598-026-36884-6

Słowa kluczowe: integracja wielozmysłowa, iluzja audiowizualna, wnioskowanie przyczynowe, postdykcja, percepcja bayesowska