Clear Sky Science · es
La representación persistente de un esquema previo en la corteza orbitofrontal facilita el aprendizaje de un esquema en conflicto
Por qué los atajos mentales pueden ayudar y perjudicar
La vida cotidiana depende de atajos mentales: una vez que aprendes las reglas de conducir o de usar una nueva aplicación, puedes reutilizar ese saber en situaciones nuevas. Pero esos mismos atajos, llamados esquemas, pueden engañarte cuando las reglas cambian de repente, como al conducir en un país donde el tráfico circula por el lado opuesto de la carretera. Este estudio plantea cómo el cerebro gestiona conjuntos de reglas antiguas y nuevas que entran en conflicto, y si conservar un esquema antiguo ayuda o dificulta el aprendizaje de uno nuevo.
Entrenar ratas para alternar entre reglas en conflicto
Los investigadores entrenaron ratas en una serie de tareas de elección basadas en olores que parecían idénticas en la superficie pero seguían reglas ocultas diferentes. En la primera fase, las ratas aprendieron una regla de “comparar con el ensayo anterior”: obtenían agua azucarada solo si el olor actual era distinto del que habían olido justo antes. Tras dominar esto, se les introdujo una segunda fase en la que se usaban exactamente las mismas señales de olor, pero ahora la recompensa dependía únicamente de la identidad de cada olor, no de la comparación con el ensayo previo. Esta nueva regla de “identidad” entraba en conflicto directo con la antigua regla de comparación. Un grupo de control separado aprendió solo la regla de identidad desde el principio, de modo que sus cerebros no tuvieron que manejar la anterior regla de comparación.

Cómo una zona de decisión del cerebro rastrea reglas ocultas
Mientras las ratas aprendían y alternaban entre reglas, el equipo registró la actividad de neuronas individuales y de grandes poblaciones celulares en una zona de toma de decisiones llamada corteza orbitofrontal, situada justo por encima de los ojos. Cuando las ratas adquirieron por primera vez la regla de comparación, cada vez más neuronas orbitofrontales comenzaron a disparar de forma diferente en ensayos recompensados frente a no recompensados, y la actividad poblacional separó con claridad los ensayos que seguían la regla. Cuando se introdujo la regla de identidad, esta área cerebral se reorganizó rápidamente para que su actividad agrupara ahora los olores según si eran recompensados bajo la nueva regla. Crucialmente, sin embargo, los rastros de la antigua regla de comparación no desaparecieron: muchas neuronas, y el patrón global de actividad, continuaron portando información sobre si un ensayo habría sido recompensado bajo la regla antigua, incluso después de que el comportamiento siguiera por completo la nueva. Las ratas control que nunca aprendieron la regla de comparación mostraron poca o ninguna de esta señal “fantasma”.
Esquemas antiguo y nuevo almacenados lado a lado, no sobrescritos
Un análisis más detallado reveló que las neuronas orbitofrontales tendían a especializarse: la mayoría señalaban recompensa frente a no recompensa para bien la regla antigua o bien la nueva, pero no para ambas. A nivel poblacional, la actividad para las dos reglas podía leerse a lo largo de “ejes” en gran medida separados, lo que significa que la región cerebral albergaba efectivamente dos mapas superpuestos pero parcialmente independientes de la tarea. Clasificadores entrenados con los datos neuronales pudieron decodificar de forma fiable tanto qué regla estaba en vigor como cuál habría sido el resultado bajo la regla alternativa. En otras palabras, en lugar de borrar el esquema previo, la corteza orbitofrontal mantuvo una representación paralela y nítida del mismo mientras construía una nueva.

Cuando un recuerdo preciso de la regla antigua ayuda a aprender la nueva
La sorpresa clave fue conductual: una representación neural más fuerte de la regla antigua, ahora irrelevante, no hizo que las ratas tendieran a aferrarse a ella. A medida que avanzaba el aprendizaje, las ratas en realidad mejoraron en ignorar las predicciones de la regla antigua, incluso en ensayos donde ésta habría señalado “ir”, y esta mejora fue mayor en animales cuya actividad orbitofrontal codificaba con mayor claridad la regla antigua. Esos mismos animales aprendieron la nueva regla de identidad más rápido, a pesar de no haber sido mejores aprendices de la primera regla. Cuando los investigadores silenciaron temporalmente neuronas orbitofrontales durante la consolidación del primer esquema en un experimento aparte, las ratas luego tuvieron dificultades tanto para generalizar la regla antigua a nuevos olores como para adquirir la nueva regla conflictiva. Esto sugiere que tener la corteza orbitofrontal representando activamente el esquema inicial prepara al cerebro para una flexibilidad posterior.
Qué significa esto para el pensamiento flexible y las máquinas inteligentes
Para un lector no especialista, el mensaje principal es que los circuitos de decisión del cerebro no simplemente sobrescriben el conocimiento antiguo cuando las reglas cambian. En lugar de eso, la corteza orbitofrontal mantiene un rastro detallado de los esquemas previos funcionando en segundo plano, mientras construye un nuevo conjunto de reglas en un canal parcialmente separado. Este almacenamiento paralelo parece apoyar, en lugar de bloquear, el comportamiento flexible: al preservar un modelo preciso de “cómo funcionaban las cosas antes”, el cerebro puede detectar mejor cuándo ese modelo falla y ajustarse a nuevas demandas. Los autores sugieren que esta estrategia —mantener múltiples mapas de reglas simultáneamente y suprimirlos o utilizarlos de forma selectiva— podría inspirar sistemas de inteligencia artificial que eviten el olvido catastrófico y aprendan nuevas tareas sin borrar lo que ya saben.
Cita: Maor, I., Atwell, J., Ascher, I. et al. Persistent representation of a prior schema in the orbitofrontal cortex facilitates learning of a conflicting schema. Nat Commun 17, 2610 (2026). https://doi.org/10.1038/s41467-026-69330-2
Palabras clave: esquemas, corteza orbitofrontal, flexibilidad cognitiva, aprendizaje por refuerzo, representaciones neuronales