Clear Sky Science · pt
Representação persistente de um esquema anterior no córtex orbitofrontal facilita a aprendizagem de um esquema conflitante
Por que atalhos mentais podem ajudar e atrapalhar
A vida cotidiana depende de atalhos mentais: uma vez que você aprende as regras de dirigir ou de usar um novo aplicativo, pode reaproveitar esse conhecimento em situações diferentes. Mas esses mesmos atalhos, chamados esquemas, podem enganar quando as regras mudam de repente, como ao dirigir em um país onde o tráfego circula no lado oposto da estrada. Este estudo investiga como o cérebro lida com conjuntos de regras antigos e novos que entram em conflito, e se manter um esquema antigo ajuda ou prejudica a aprendizagem de um novo.
Treinando ratos a alternar entre regras conflitantes
Os pesquisadores treinaram ratos em uma série de tarefas de escolha baseadas em odores que pareciam idênticas na superfície, mas seguiam regras ocultas diferentes. Na primeira fase, os ratos aprenderam uma regra de “comparar com o último ensaio”: recebiam água açucarada apenas se o odor atual fosse diferente daquele que tinham cheirado no ensaio anterior. Depois de dominarem isso, foram introduzidos na segunda fase em que exatamente os mesmos indícios olfativos eram usados, mas agora a recompensa dependia apenas da identidade de cada odor, não da comparação com o ensaio anterior. Essa nova regra de “identidade” entrou em conflito direto com a antiga regra de comparação. Um grupo controle separado aprendeu apenas a regra de identidade desde o início, de modo que seus cérebros nunca precisaram lidar com a regra anterior de comparação.

Como uma área decisória do cérebro rastreia regras ocultas
Enquanto os ratos aprendiam e alternavam entre regras, a equipe registrou a atividade de neurônios individuais e de grandes grupos de células em uma área decisória chamada córtex orbitofrontal, localizada logo acima dos olhos. À medida que os ratos adquiriam a regra de comparação, cada vez mais neurônios orbitofrontais passaram a disparar de forma diferente em ensaios recompensados versus não recompensados, e a atividade populacional separava claramente os ensaios que seguiam a regra. Quando a regra de identidade foi introduzida, essa área cerebral reorganizou‑se rapidamente, de modo que sua atividade agora agrupava odores conforme fossem recompensados sob a nova regra. Crucialmente, porém, traços da antiga regra de comparação não desapareceram: muitos neurônios, e o padrão geral de atividade, continuaram a carregar informação sobre se um ensaio teria sido recompensado pela regra anterior, mesmo depois que o comportamento passou a seguir completamente a nova. Ratos controle que nunca aprenderam a regra de comparação mostraram pouco ou nenhum desse sinal “fantasma”.
Esquemas antigo e novo armazenados lado a lado, não sobrescritos
Análises mais detalhadas revelaram que os neurônios orbitofrontais tendiam a se especializar: a maioria sinalizava recompensa versus ausência de recompensa para ou a regra antiga ou a nova, mas não para ambas. No nível populacional, a atividade relativa às duas regras podia ser lida ao longo de “eixos” em grande parte separados, o que significa que a área cerebral efetivamente hospedava dois mapas sobrepostos, porém parcialmente independentes, da tarefa. Classificadores treinados com os dados neurais conseguiram decodificar de forma confiável tanto qual regra estava em vigor quanto qual teria sido o resultado sob a regra alternativa. Em outras palavras, em vez de apagar o esquema anterior, o córtex orbitofrontal manteve uma representação paralela e limpa dele enquanto construía a nova.

Quando uma memória precisa da regra antiga ajuda a aprender a nova
A surpresa central foi comportamental: uma representação neural mais forte da regra antiga, agora irrelevante, não fez com que os ratos se apegassem mais a ela. À medida que o aprendizado progredia, os ratos na verdade ficaram melhores em ignorar as previsões da regra antiga, mesmo em ensaios nos quais ela teria sinalizado “vá”, e essa melhora foi maior nos animais cuja atividade orbitofrontal codificava mais claramente a regra antiga. Esses mesmos animais aprenderam a nova regra de identidade mais rapidamente, apesar de não terem sido aprendizes melhores da primeira regra. Quando os pesquisadores silenciaram temporariamente neurônios orbitofrontais durante a consolidação do primeiro esquema em um experimento separado, os ratos depois tiveram dificuldade tanto para generalizar a regra antiga para novos odores quanto para assimilar a nova regra conflitante. Isso sugere que ter o córtex orbitofrontal representando ativamente o esquema inicial prepara o cérebro para maior flexibilidade posterior.
O que isso significa para o pensamento flexível e máquinas inteligentes
Para um leigo, a mensagem principal é que os circuitos decisórios do cérebro não simplesmente sobrescrevem conhecimentos antigos quando as regras mudam. Em vez disso, o córtex orbitofrontal mantém um traço detalhado dos esquemas prévios rodando em segundo plano, enquanto constrói um novo conjunto de regras em um canal parcialmente separado. Esse armazenamento paralelo parece apoiar, em vez de bloquear, o comportamento flexível: ao preservar um modelo preciso de “como as coisas funcionavam antes”, o cérebro consegue detectar melhor quando esse modelo falha e ajustar‑se a novas demandas. Os autores sugerem que essa estratégia — manter múltiplos mapas de regras ao mesmo tempo e suprimir ou usar cada um seletivamente — poderia inspirar sistemas de inteligência artificial que evitem o esquecimento catastrófico e aprendam novas tarefas sem apagar o que já sabem.
Citação: Maor, I., Atwell, J., Ascher, I. et al. Persistent representation of a prior schema in the orbitofrontal cortex facilitates learning of a conflicting schema. Nat Commun 17, 2610 (2026). https://doi.org/10.1038/s41467-026-69330-2
Palavras-chave: esquemas, córtex orbitofrontal, flexibilidade cognitiva, aprendizado por reforço, representações neurais