Clear Sky Science · fr
Représentation persistante d’un schéma antérieur dans le cortex orbitofrontal facilite l’apprentissage d’un schéma en conflit
Pourquoi les raccourcis mentaux aident et nuisent à la fois
La vie quotidienne repose sur des raccourcis mentaux : une fois que vous avez appris les règles pour conduire ou utiliser une nouvelle application, vous pouvez réutiliser ce savoir dans des situations différentes. Mais ces mêmes raccourcis, appelés schémas, peuvent vous induire en erreur quand les règles changent soudainement, comme conduire dans un pays où la circulation se fait de l’autre côté de la route. Cette étude examine comment le cerveau gère des ensembles de règles anciens et nouveaux qui entrent en conflit, et si le maintien d’un ancien schéma aide ou gêne l’apprentissage d’un nouveau.
Apprendre à des rats à alterner entre des règles conflictuelles
Les chercheurs ont entraîné des rats à une série de tâches de choix basées sur des odeurs qui se présentaient identiques en surface mais suivaient des règles cachées différentes. Dans la première phase, les rats ont appris une règle de « comparer avec l’essai précédent » : ils obtenaient de l’eau sucrée seulement si l’odeur actuelle était différente de celle qu’ils venaient de sentir. Après maîtrise de cette règle, on leur a présenté une seconde phase dans laquelle exactement les mêmes stimuli olfactifs étaient utilisés, mais désormais la récompense dépendait uniquement de l’identité de chaque odeur, pas de sa comparaison avec l’essai précédent. Cette nouvelle règle d’« identité » entrait directement en conflit avec la précédente règle de comparaison. Un groupe de contrôle séparé a appris uniquement la règle d’identité dès le départ, de sorte que leur cerveau n’a jamais eu à gérer la règle de comparaison initiale.

Comment une région décisionnelle du cerveau suit des règles cachées
Pendant que les rats apprenaient et alternaient entre les règles, l’équipe a enregistré l’activité de neurones individuels et de populations cellulaires dans une zone de prise de décision appelée cortex orbitofrontal, située juste au‑dessus des yeux. À mesure que les rats acquéraient la règle de comparaison, de plus en plus de neurones orbitofrontaux modifiaient leur activité entre essais récompensés et non récompensés, et l’activité de la population distinguait nettement les essais conformes à la règle. Lors de l’introduction de la règle d’identité, cette région cérébrale s’est rapidement réorganisée de sorte que son activité regroupait désormais les odeurs selon qu’elles étaient récompensées sous la nouvelle règle. Il est essentiel de noter, cependant, que des traces de l’ancienne règle de comparaison n’ont pas disparu : de nombreux neurones, et le schéma global d’activité, continuaient de porter l’information quant à savoir si un essai aurait été récompensé sous l’ancienne règle, même après que le comportement ait totalement suivi la nouvelle. Les rats du groupe contrôle, qui n’avaient jamais appris la règle de comparaison, présentaient peu voire aucun de ces signaux « fantômes ».
Anciens et nouveaux schémas stockés côte à côte, pas effacés
Une analyse plus fine a montré que les neurones orbitofrontaux avaient tendance à se spécialiser : la plupart signalaient la récompense versus l’absence de récompense pour l’une ou l’autre règle, mais pas pour les deux en même temps. Au niveau de la population, l’activité correspondant aux deux règles pouvait être lue selon des « axes » largement séparés, ce qui signifie que cette zone cérébrale hébergeait effectivement deux cartes de la tâche qui se chevauchent mais restent partiellement indépendantes. Des classifieurs entraînés sur les données neuronales pouvaient décoder de manière fiable à la fois la règle en vigueur et quel aurait été le résultat sous la règle alternative. Autrement dit, au lieu d’effacer le schéma précédent, le cortex orbitofrontal maintenait une représentation parallèle et distincte de celui‑ci tout en construisant la nouvelle.

Quand un souvenir fidèle de l’ancienne règle favorise l’apprentissage du nouveau
La surprise principale était comportementale : une représentation neuronale plus forte de l’ancienne règle, désormais sans rapport, n’incitait pas les rats à s’y accrocher davantage. Au fur et à mesure de l’apprentissage, les rats sont en fait devenus meilleurs pour ignorer les prédictions de l’ancienne règle, même lors d’essais où celle‑ci aurait indiqué « go », et cette amélioration était la plus marquée chez les animaux dont l’activité orbitofrontale encodait le plus clairement l’ancienne règle. Ces mêmes animaux ont appris la nouvelle règle d’identité plus rapidement, bien qu’ils n’aient pas été de meilleurs apprenants pour la première règle. Lorsque les chercheurs ont temporairement silencieux les neurones orbitofrontaux pendant la consolidation du premier schéma dans une expérience distincte, les rats ont ensuite eu des difficultés à généraliser l’ancienne règle à de nouvelles odeurs et à acquérir la nouvelle règle conflictuelle. Cela suggère que la représentation active du schéma initial par le cortex orbitofrontal prépare le cerveau à une flexibilité ultérieure.
Ce que cela signifie pour la pensée flexible et les machines intelligentes
Pour le grand public, le message principal est que les circuits décisionnels du cerveau n’effacent pas simplement les connaissances anciennes lorsque les règles changent. Au lieu de cela, le cortex orbitofrontal conserve une trace détaillée des schémas antérieurs en arrière‑plan, tout en construisant un nouvel ensemble de règles dans un canal en partie séparé. Ce stockage parallèle semble soutenir, plutôt que bloquer, le comportement flexible : en préservant un modèle précis de « comment les choses fonctionnaient avant », le cerveau peut mieux détecter quand ce modèle échoue et s’adapter aux nouvelles exigences. Les auteurs suggèrent que cette stratégie — maintenir plusieurs cartes de règles en parallèle et les supprimer ou les utiliser de manière sélective — pourrait inspirer des systèmes d’intelligence artificielle qui évitent l’oubli catastrophique et apprennent de nouvelles tâches sans effacer ce qu’ils savent déjà.
Citation: Maor, I., Atwell, J., Ascher, I. et al. Persistent representation of a prior schema in the orbitofrontal cortex facilitates learning of a conflicting schema. Nat Commun 17, 2610 (2026). https://doi.org/10.1038/s41467-026-69330-2
Mots-clés: schémas, cortex orbitofrontal, flexibilité cognitive, apprentissage par renforcement, représentations neuronales