Clear Sky Science · es

Las conexiones recurrentes facilitan el reconocimiento de objetos ocultos mediante el "explaining-away"

· Volver al índice

Cómo el cerebro ve lo que no está

En la vida cotidiana reconocemos sin esfuerzo objetos que están parcialmente ocultos: un gato detrás de una cortina, un coche detrás de un árbol. Este artículo pregunta cómo el cerebro, y las redes artificiales inspiradas en el cerebro, logran esta proeza. Los autores muestran que los circuitos con bucles de retroalimentación pueden usar la información sobre el objeto que tapa para “rellenar” mentalmente lo que hay detrás, revelando un truco clave en el que podría apoyarse nuestro sistema visual cuando el mundo está abarrotado e incompleto.

Figure 1
Figure 1.

Por qué los objetos ocultos son un problema difícil

Cuando un objeto está oculto, muchas de sus características visuales habituales faltan o están distorsionadas. Un sistema visual feedforward simple, donde la información fluye directamente desde los ojos hasta los centros de reconocimiento, debe adivinar el objeto oculto basándose solo en los fragmentos visibles. Los cerebros biológicos, sin embargo, están llenos de conexiones recurrentes: bucles donde las áreas superiores vuelven a comunicarse con las anteriores. Se sospecha desde hace tiempo que estos bucles ayudan en tareas difíciles como reconocer objetos ocultos, pero no quedaba claro qué ventaja específica aportan ni cómo cambian las representaciones internas de lo que vemos.

Poniendo a prueba redes inspiradas en el cerebro

Los autores construyeron una amplia batería de redes neuronales convolucionales profundas que imitan etapas del procesamiento visual. Algunas eran puramente feedforward, mientras otras incorporaban bucles recurrentes o retroalimentación descendente adicional. Entrenaron estos modelos con conjuntos de imágenes a medida en los que un artículo de moda cubría parcialmente a otro. Las redes tenían que identificar tanto el objeto delantero (oclusor) como el trasero (oculto) en distintos planteamientos de la tarea. El rendimiento dependió menos de si la red era recurrente o feedforward y más de su “profundidad computacional”: cuántos pasos de procesamiento secuenciales atravesaba una entrada. Modelos feedforward profundos pudieron igualar o superar a los recurrentes en la tarea básica de reconocimiento, mostrando que la recurrencia no es superior por sí sola.

Un truco especial: explicar la causa del oclusor

Aunque la profundidad importaba más para la precisión bruta, las redes recurrentes mostraron una ventaja distintiva en la forma de usar el contexto. Cuando a estas redes se les pedía primero identificar el objeto delantero y solo después el oculto, su rendimiento sobre el objeto oculto mejoró en comparación con cuando lo clasificaban de forma aislada. Este patrón no apareció en redes feedforward ordinarias que daban ambas etiquetas a la vez. Los autores interpretan esto como “explaining away”: una vez que el sistema ha reconocido el oclusor, puede tratar las características extrañas o faltantes en la imagen como causadas por ese oclusor, en lugar de tomarlas como evidencia de algún objeto nuevo extraño. En escenas 3D más realistas y en un modelo inspirado en primates (CORnet), el mismo orden —objeto delantero antes que objeto oculto— también potenció el reconocimiento.

Figure 2
Figure 2.

Viendo el mismo efecto en las personas

Para preguntar si los humanos usan una estrategia similar, los investigadores realizaron un experimento en línea. Los participantes vieron brevemente un solo objeto, luego una escena donde un objeto ocultaba a otro, y finalmente debían elegir cuál de dos opciones había sido el objeto oculto. En algunas pruebas, el objeto único inicial era el mismo que el posterior oclusor; en otras, no tenía relación. Cuando las personas acababan de ver el oclusor real, identificaban el objeto oculto con más precisión y respondían más rápido, a través de diversos niveles de oclusión. Esto sugiere que nuestros cerebros, al igual que las redes recurrentes, se benefician de procesar primero el elemento que tapa y luego usar ese conocimiento para interpretar la evidencia parcial de lo que hay detrás.

Reconstruir imágenes ocultas desde dentro

Para ahondar en el mecanismo, los autores diseñaron un modelo más inspirado biológicamente, Recon-Net, basado de forma aproximada en las interacciones entre la corteza visual y la corteza prefrontal. Recon-Net recibe una imagen que contiene un objeto ocultado más una vista separada del oclusor y transforma iterativamente una representación interna hasta que coincide con cómo debería verse una versión no ocluida del objeto oculto. De forma sorprendente, los clasificadores entrenados solo con imágenes limpias y no ocluidas pueden reconocer las salidas de Recon-Net casi tan bien como si hubieran sido entrenados directamente con ejemplos ocluidos. Esto significa que el procesamiento recurrente “reconstituye” efectivamente una imagen interna limpia del objeto oculto, aunque los píxeles falten.

Qué significa esto para cerebros y máquinas

En conjunto, el estudio muestra que los bucles de retroalimentación no se tratan simplemente de rendimiento bruto, sino de una forma cualitativamente distinta de usar el contexto. Las conexiones recurrentes sostienen de forma natural el explaining-away: permiten que el sistema visual tenga en cuenta cómo un oclusor distorsiona lo que vemos y restaurar una representación interna estable del objeto oculto. Al mismo tiempo, los autores encuentran que entrenar con imágenes muy ocluidas puede dejar las respuestas a imágenes claras en gran medida sin cambios, lo que podría facilitar el aprendizaje en cerebros reales al evitar un recableado constante. Estas ideas apuntan a un principio común para la neurociencia y la inteligencia artificial: cuando el mundo oculta información, los sistemas inteligentes no solo miran más, sino que inferen por qué falta.

Cita: Kang, B., Midler, B., Chen, F. et al. Recurrent connections facilitate occluded object recognition by explaining-away. Nat Commun 17, 2225 (2026). https://doi.org/10.1038/s41467-026-68806-5

Palabras clave: reconocimiento de objetos ocultos, redes neuronales recurrentes, percepción visual, explaining away, neurociencia computacional