Clear Sky Science · es

La inferencia causal moldea la postdictión crossmodal en la integración multisensorial

2026-02-21 · Volver al índice

Cómo vistas y sonidos posteriores reescriben lo que acabamos de experimentar

Recuerda cuando notaste a un amigo llamando tu nombre en una calle concurrida y de pronto te diste cuenta de que llevaba gritando un rato. Puede sentirse como si tu mente retrocediera en el tiempo y reescribiera lo que oíste y viste un momento antes. Este estudio explora cómo el cerebro combina lo que llega por los ojos y los oídos en una breve ventana temporal y muestra que vistas y sonidos posteriores pueden literalmente cambiar lo que creemos haber visto en el pasado.

Un truco extraño de destellos y pitidos

Los investigadores se centraron en dos ilusiones curiosas llamadas el “conejo audiovisual ilusorio (AV)” y el “conejo audiovisual invisible”. En estas ilusiones, breves destellos de luz en una pantalla se emparejan con rápidos pitidos de un altavoz. A veces falta un destello pero hay un pitido; otras veces hay un destello sin pitido. Cuando los destellos y los pitidos se organizan en una secuencia específica y ocurren muy cerca en el tiempo, la gente informa con fiabilidad haber visto un destello extra que nunca apareció, o no ver un destello que sí estuvo presente. De forma crucial, el último par destello–pitido de la secuencia puede cambiar cómo las personas perciben momentos anteriores, mostrando que la percepción no avanza simplemente hacia adelante en el tiempo, sino que puede editarse a posteriori.

Probar cómo el cerebro elige una sola historia

Para entender las reglas ocultas detrás de estas ilusiones, el equipo presentó 28 condiciones diseñadas cuidadosamente a 28 voluntarios. A los participantes se les pidió que ignoraran los sonidos y simplemente informaran cuántos destellos habían visto y dónde aparecieron en una fila de cinco posiciones posibles. Las secuencias de destellos podían moverse a la izquierda o a la derecha o incluso cambiar de dirección, y los sonidos podían estar perfectamente sincronizados con los destellos o desfasados unos dos décimos de segundo. Este diseño redujo estrategias de adivinanza simples y permitió a los investigadores sondear cuándo el cerebro combinaría vista y sonido y cuándo los mantendría separados. Luego midieron con qué frecuencia las personas informaban destellos intermedios ilusorios (el “conejo ilusorio”) o no detectaban destellos intermedios reales (el “conejo invisible”).

Cuando el tiempo encaja, las ilusiones dominan

Los resultados mostraron que en los ensayos con ilusión se produjeron muchos más destellos ilusorios o faltantes que en los ensayos de control en los que los destellos aparecían solos o en combinaciones audiovisualess más simples. Cuando los destellos y los pitidos estaban perfectamente alineados en el tiempo, los participantes informaron las ilusiones en aproximadamente el 40 por ciento de los ensayos. Pero cuando los sonidos precedían o seguían a los destellos por 225 milisegundos, las tasas de ilusión disminuyeron. Esto sugiere que el cerebro tiene una “ventana temporal multisensorial” limitada—de unos pocos cientos de milisegundos—dentro de la cual está dispuesto a tratar vista y sonido como parte del mismo evento. Dentro de esta ventana, los eventos posteriores pueden cambiar retroactivamente cómo se perciben destellos anteriores; fuera de ella, el cerebro es más propenso a tratar la visión y la audición como flujos no relacionados.

Un cerebro que pondera causas como un estadístico

Para explicar estos hallazgos, los autores compararon cuatro modelos computacionales de cómo el cerebro podría combinar la información sensorial. El modelo clave fue un modelo de Inferencia Causal Bayesiana (BCI), que asume que el cerebro se comporta un poco como un estadístico: pondera expectativas previas y evidencia sensorial ruidosa para decidir si la visión y la audición provienen de una sola causa común o de causas separadas. Si una causa común es probable, el modelo fusiona destellos y pitidos en un único evento, dando más peso al sentido más fiable—en este caso, los pitidos, nítidos y precisos. Tres modelos alternativos o bien siempre fusionaban vista y sonido, o siempre los mantenían separados, o empleaban inferencia causal pero ignoraban el último par destello–pitido al tomar la decisión, y por tanto no podían capturar plenamente la postdictión.

Por qué la historia bayesiana encaja mejor

El modelo BCI encajó mejor con el comportamiento de las personas en todas las condiciones. Reprodujo con precisión las altas tasas de ilusión en las condiciones clave del conejo, las tasas más bajas en los ensayos de control y la caída en las ilusiones cuando destellos y pitidos estaban desincronizados. Es importante que, cuando los investigadores eliminaron la influencia del último par destello–pitido del cálculo causal, el modelo subestimó sistemáticamente con qué frecuencia se producían las ilusiones. Esto indica que el cerebro no construye la percepción simplemente desde el primer evento hacia adelante; en cambio, acumula evidencia a lo largo de toda la secuencia y luego decide retrospectivamente la narrativa más probable. Cuando el último par destello–pitido apoya con fuerza una causa compartida, el cerebro está más dispuesto a “rellenar” un destello faltante o a borrar uno débil en el medio.

Qué significa esto para la percepción cotidiana

En la vida diaria, nuestros sentidos están constantemente inundados de vistas y sonidos superpuestos. Este trabajo sugiere que el cerebro espera un breve momento, reúne información de eventos pasados, presentes y ligeramente futuros, y luego se decide por una interpretación coherente—a veces a costa de la exactitud. El marco de inferencia causal bayesiana ofrece una explicación sencilla: nuestros cerebros favorecen una única historia plausible de lo que ocurrió, aunque eso implique añadir o borrar detalles a posteriori. En otras palabras, lo que crees haber visto hace una fracción de segundo puede reescribirse silenciosamente por lo que escuches o veas acto seguido.

Cita: Günaydın, G., Moran, J.K., Rohe, T. et al. Causal inference shapes crossmodal postdiction in multisensory integration. Sci Rep 16, 7490 (2026). https://doi.org/10.1038/s41598-026-36884-6

Palabras clave: integración multisensorial, ilusión audiovisual, inferencia causal, postdictión, percepción bayesiana