Clear Sky Science · ru

Каузальное выводение формирует постдикцию между модальностями в мультисенсорной интеграции

2026-02-21 · Назад к списку

Как последующие зрительные и слуховые сигналы переписывают то, что мы только что пережили

Вспомните ситуацию, когда вы заметили, что друг зовёт вас на шумной улице, и вдруг осознали, что он кричал уже некоторое время. Кажется, будто ваш разум возвращается назад во времени и переписывает то, что вы слышали и видели мгновение назад. В этом исследовании изучают, как мозг объединяет сигналы из глаз и ушей в коротком временном окне, и показывают, что последующие зрительные и слуховые события буквально могут изменить то, что мы считаем виденным в прошлом.

Странный трюк со вспышками и звуками

Исследователи сосредоточились на двух любопытных иллюзиях, называемых «иллюзорный аудиовизуальный (AV) кролик» и «невидимый AV-кролик». В этих иллюзиях короткие вспышки на экране сопровождаются быстрыми звуковыми сигналами из динамика. Иногда вспышка отсутствует, но звук есть; иногда вспышка есть без звука. Когда вспышки и звуки расположены в определённой последовательности и происходят вплотную по времени, люди надёжно сообщают о дополнительной вспышке, которой не было, или не замечают реальную вспышку. Важно, что последняя пара вспышка–звук в последовательности может изменить восприятие более ранних моментов, показывая, что восприятие не просто движется вперёд во времени, а может быть отредактировано задним числом.

Проверка того, как мозг выбирает одну историю событий

Чтобы понять скрытые правила этих иллюзий, команда представила 28 тщательно спроектированных условий 28 добровольцам. Участникам сказали игнорировать звуки и просто сообщать, сколько вспышек они увидели и где они появились на ряду из пяти возможных позиций. Последовательности вспышек могли двигаться влево или вправо или даже менять направление, а звуки могли быть идеально синхронизированы с вспышками или смещены примерно на две десятых секунды. Такой дизайн снижал простые стратегии угадывания и позволял исследовать, когда мозг будет объединять зрение и слух, а когда будет держать их раздельно. Затем измеряли, как часто люди сообщали об иллюзорных средних вспышках («иллюзорный кролик») или не замечали реальные средние вспышки («невидимый кролик»).

Когда совпадает время, иллюзии берут верх

Результаты показали, что в экспериментальных условиях иллюзии вызывали значительно больше дополнительных или пропущенных вспышек, чем в контрольных условиях, где вспышки появлялись в одиночку или в более простых аудиовизуальных сочетаниях. Когда вспышки и звуки были идеально синхронизированы, участники сообщали об иллюзиях примерно в 40% испытаний. Но когда звуки опережали или отставали от вспышек на 225 миллисекунд, частота иллюзий падала. Это указывает на то, что у мозга есть ограниченное «мультисенсорное временное окно» — длительностью в несколько сотен миллисекунд — в пределах которого он готов воспринимать зрение и слух как часть одного события. Внутри этого окна последующие события могут ретроспективно изменить восприятие более ранних вспышек; вне его мозг с большей вероятностью будет трактовать зрение и слух как независимые потоки.

Мозг, который взвешивает причины как статистик

Чтобы объяснить эти наблюдения, авторы сравнили четыре вычислительные модели того, как мозг может комбинировать сенсорную информацию. Ключевой моделью была байесовская модель каузального вывода (BCI), которая предполагает, что мозг ведёт себя немного как статистик: он взвешивает априорные ожидания и зашумлённые сенсорные данные, чтобы решить, исходят ли зрение и слух от одной общей причины или от разных причин. Если общая причина вероятна, модель объединяет вспышки и звуки в одно событие, отдавая больше веса более надёжному чувству — в этом случае чётким и точным звукам. Три альтернативные модели либо всегда сливались зрение и слух, либо всегда держали их раздельно, либо использовали каузальное выводение, но игнорировали последнюю пару вспышка–звук при принятии решения и поэтому не могли полностью объяснить постдикцию.

Почему байесовская версия подходит лучше

Модель BCI лучше всего соответствовала поведению людей во всех условиях. Она точно воспроизводила высокий уровень иллюзий в ключевых условиях с «кроликом», более низкие показатели в контрольных испытаниях и снижение частоты иллюзий при рассинхронизации вспышек и звуков. Важно, что когда исследователи исключали влияние последней пары вспышка–звук из каузального расчёта, модель последовательно недооценивала частоту появления иллюзий. Это указывает на то, что мозг не просто строит перцепт от первого события вперёд; вместо этого он аккумулирует доказательства по всей последовательности, а затем ретроспективно выбирает наиболее правдоподобный сценарий. Когда последняя пара вспышка–звук сильно поддерживает общую причину, мозг с большей готовностью «добавляет» отсутствующую вспышку или «стират» слабую среднюю вспышку.

Что это означает для повседневного восприятия

В повседневной жизни наши органы чувств постоянно перегружены перекрывающимися зрительными и слуховыми сигналами. Эта работа показывает, что мозг ждёт короткий момент, собирает информацию из прошлых, текущих и слегка будущих событий, а затем выстраивает согласованную интерпретацию — иногда ценой точности. Байесовская рамка каузального вывода даёт простое объяснение: наш мозг предпочитает одну правдоподобную версию произошедшего, даже если это означает добавление или удаление деталей задним числом. Другими словами, то, что вы думали, что увидели долю секунды назад, может тихо переписаться тем, что вы увидите или услышите дальше.

Цитирование: Günaydın, G., Moran, J.K., Rohe, T. et al. Causal inference shapes crossmodal postdiction in multisensory integration. Sci Rep 16, 7490 (2026). https://doi.org/10.1038/s41598-026-36884-6

Ключевые слова: мультисенсорная интеграция, аудиовизуальная иллюзия, каузальное выводение, постдикция, байесовское восприятие