Clear Sky Science · zh
因果推断塑造多感觉整合中的跨模态事后修正
后来看到或听到的东西如何改写我们刚刚经历的感觉
回想一下在人来人往的街道上注意到朋友叫你名字、随后突然意识到他们已经喊了好一会儿的情景。那种感觉仿佛你的大脑回到过去,改写了你刚才听到和看到的内容。该研究探讨了大脑如何在一个短时间窗口内整合来自眼睛和耳朵的信息,结果显示后来的视觉和听觉信息实际上可以改变我们对过去所见的信念。

闪光与滴答声的奇怪把戏
研究者关注两种奇特的幻觉,称为“视听幻兔(Illusory Audiovisual, AV Rabbit)”和“隐形视听幻兔(Invisible AV Rabbit)”。在这些幻觉中,屏幕上的短促闪光与扬声器发出的快速滴答声配对。有时闪光缺失但有滴答声;有时闪光出现而无声音。当闪光和滴答按特定序列且在时间上紧密排列时,人们会可靠地报告看到一个从未出现的额外闪光,或者未能看到一个实际上确实存在的闪光。关键在于,序列中的最后一对闪光—滴答可以改变人们对早先时刻的感知,这表明感知并非简单地向前推进,而是可以在事后被编辑。
测试大脑如何选择单一解释
为了解释这些幻觉背后的隐含规则,团队向28名志愿者呈现了28个精心设计的条件。参与者被告知忽略声音,仅报告他们看到的闪光数量以及它们在五个可能位置中的所在位置。闪光序列可以向左或向右移动,甚至改变方向,声音可以与闪光完美同步或相差大约两百分之一秒(约225毫秒)。该设计减少了简单猜测策略,使研究者能够探查大脑何时会将视觉与听觉合并,何时会将它们视为分离流。他们随后测量了人们报告出现幻觉中间闪光(“幻兔”)或漏报真实中间闪光(“隐形幻兔”)的频率。
当时序对齐时,幻觉占上风
结果显示,在幻觉试验中,出现幻觉或缺失闪光的次数远高于仅有闪光或更简单视听组合的对照试验。当闪光与滴答在时间上完全对齐时,参与者在大约40%的试验中报告了幻觉。但当声音领先或落后闪光约225毫秒时,幻觉发生率下降。这表明大脑存在一个有限的“多感觉时间窗口”——持续几百毫秒——在此窗口内它更倾向于将视觉和听觉视为同一事件的一部分。在这个窗口内,后来的事件可以回过头来改变对较早闪光的感知;在窗口之外,大脑更可能把视觉和听觉视为不相关的流。

像统计学家一样权衡原因的大脑
为了解释这些发现,作者比较了四种关于大脑如何整合感官信息的计算模型。关键模型是贝叶斯因果推断(Bayesian Causal Inference, BCI)模型,该模型假定大脑有点像一个统计学家:它权衡先验期望与噪声感官证据,以决定视觉和听觉是来自单一共同原因还是来自不同原因。如果共同原因的可能性较大,模型就会将闪光和滴答合并为单一事件,并更多地依赖更可靠的感觉——在本研究中是清晰且精确的滴答声。三种替代模型要么总是融合视听信息,要么总是将它们分开,要么使用因果推断但在做出决定时忽略序列中的最后一对闪光—滴答,因此无法完全解释事后修正现象。
为什么贝叶斯解释最为贴合
BCI模型在所有条件下最能匹配人的行为。它准确再现了关键幻兔条件下的高幻觉率、对照试验中的较低发生率以及当闪光与滴答不同步时幻觉率的下降。重要的是,当研究者从因果计算中移除最后一对闪光—滴答的影响时,模型持续低估幻觉发生的频率。这表明大脑并非只是从第一个事件向前构建感知;相反,它在整个序列中积累证据,然后回顾性地决定最可能的叙事。当最后一对闪光—滴答强烈支持单一共同原因时,大脑更倾向于“填补”缺失的闪光或抹去中间的弱闪光。
这对日常感知意味着什么
在日常生活中,我们的感觉不断被重叠的视觉和听觉充斥。该研究表明,大脑会等待片刻,从过去、现在以及略微未来的事件中收集信息,然后确立一个连贯的解释——有时以牺牲准确性为代价。贝叶斯因果推断框架提供了一个简明的解释:我们的脑子偏好一个单一、合理的发生故事,即便这意味着在事后添加或抹去细节。换句话说,你以为在一瞬间看到的东西,可能会被随后听到或看到的内容悄然改写。
引用: Günaydın, G., Moran, J.K., Rohe, T. et al. Causal inference shapes crossmodal postdiction in multisensory integration. Sci Rep 16, 7490 (2026). https://doi.org/10.1038/s41598-026-36884-6
关键词: 多感觉整合, 视听幻觉, 因果推断, 事后修正, 贝叶斯知觉