Clear Sky Science · fr

La réutilisation de schémas spécifiques au domaine favorise un apprentissage méta flexible dans le cerveau des primates

2026-01-29 · Retour à l’index

Pourquoi l'expérience passée facilite les nouveaux apprentissages

Pourquoi l'apprentissage d'une nouvelle compétence au sein d'une famille de compétences familière semble-t-il souvent plus facile — comme reprendre le badminton après des années de tennis, ou s'adapter à un nouveau smartphone après en avoir possédé plusieurs ? Cet article examine comment le cerveau des primates réalise ce tour de force. En étudiant des macaques qui apprennent une série de tâches visuel-vers-mouvement, les auteurs dévoilent comment le cerveau stocke des « modèles » décisionnels réutilisables tout en restant suffisamment flexible pour gérer des situations inédites, offrant des pistes pour les neurosciences et l'intelligence artificielle.

Des motifs cérébraux qui captent des règles générales

Les chercheurs se concentrent sur un concept que les psychologues appellent schéma — un cadre mental qui saisit la structure commune d'expériences apparentées. Au niveau neuronal, ils désignent cela comme des corrélats neuronaux de schéma (CNS) : des motifs d'activité stables qui réapparaissent lorsque des règles similaires sont appliquées dans des contextes différents. La grande question est de savoir comment le cerveau peut préserver ces motifs stables, qui accélèrent les apprentissages futurs, sans devenir rigide et incapable de s'adapter quand les circonstances changent. Ce compromis est connu sous le nom de dilemme stabilité–plasticité et constitue aussi un défi majeur pour la conception de réseaux de neurones artificiels devant apprendre en continu sans « oublier » ce qu'ils savent déjà.

Apprendre de nouvelles règles aux singes et revisiter les anciennes

Pour explorer cela, trois macaques ont été entraînés à des tâches de mappage visuomoteur. À chaque essai, une image apparaissait sur un écran tactile, et après un court délai le macaque devait presser l'un des deux boutons, par exemple haut ou bas, pour obtenir une récompense. Lors de chaque session d'entraînement, les animaux apprenaient d'abord un nouveau mappage entre images et actions (tâche A), puis une ou deux autres nouvelles associations (tâches B et parfois C), puis retrouvaient le mappage initial (Revisit-A), et dans certains cas apprenaient enfin l'inverse de la règle originale (Reverse-A), où les mêmes images exigeaient désormais le bouton opposé. Pendant que les macaques travaillaient, les chercheurs enregistraient l'activité de centaines de neurones dans le cortex prémoteur dorsolatéral, une région impliquée dans la planification des mouvements et la prise de décision.

Quand des tâches similaires deviennent plus faciles — mais les règles opposées plus difficiles

Au niveau comportemental, les macaques ont montré un effet classique de « learning to learn ». De nouvelles tâches similaires (B et C) ont été apprises plus rapidement que la première tâche A, et lorsqu'ils sont revenus au mappage d'origine (Revisit-A), ils l'ont réappris encore plus vite. En revanche, le mappage inversé (Reverse-A), qui contredisait directement ce qu'ils avaient appris auparavant, a pris plus de temps à maîtriser. Ce schéma suggère que les connaissances antérieures aident lorsque de nouvelles tâches partagent la même règle sous-jacente, mais peuvent en réalité ralentir quand la nouvelle règle entre en conflit avec l'ancienne. Les enregistrements neuronaux ont offert un éclairage sur les raisons : ils ont révélé quels aspects des tâches étaient codés dans des motifs stables et réutilisables et lesquels étaient laissés à la modification.

Séparer des décisions stables des informations visuelles changeantes

À l'aide de méthodes d'analyse avancées, les auteurs ont décomposé l'activité de population dans le cortex prémoteur en deux « sous-espaces » principaux — ensembles de motifs d'activité neuronale portant différents types d'information. Un sous-espace capturait les décisions des macaques (par exemple choisir le bouton supérieur plutôt que l'inférieur). L'autre sous-espace portait les détails des images visuelles. Dans le sous-espace lié à la décision, les mêmes choix formaient des trajectoires stables et de faible dimension réutilisées à travers les tâches A, B, C et Revisit-A, même lorsque les images changeaient. Plus les trajectoires étaient similaires entre une nouvelle tâche et la tâche initiale, moins le macaque avait besoin d'essais pour l'apprendre. En revanche, dans la tâche inversée, ces motifs décisionnels n'étaient pas réutilisés : les trajectoires neuronales se déplaçaient, et l'apprentissage était plus lent. Lorsqu'il s'agissait de l'information visuelle, le sous-espace associé variait plus librement d'une tâche à l'autre et ne montrait pas la même réutilisation stable.

Garder les flux d'information presque perpendiculaires

Une découverte frappante était la relation géométrique entre ces deux sous-espaces. Mathématiquement, ils étaient presque orthogonaux — disposés dans l'espace d'activité neuronale avec des angles proches de 90 degrés. Cette disposition quasi perpendiculaire signifie que les changements dans la représentation de l'information visuelle ont un impact minimal sur les motifs décisionnels, et vice versa. Autrement dit, le cerveau semble abriter des schémas décisionnels stables et réutilisables dans un domaine, tout en laissant un autre domaine flexible pour de nouveaux détails sensoriels, les deux étant suffisamment séparés pour éviter les interférences. Cette architecture pourrait être un principe général observé dans d'autres régions du cerveau impliquées dans des comportements complexes.

Ce que cela signifie pour les cerveaux et les machines

Pour un lecteur général, la conclusion est que le cerveau semble résoudre le dilemme stabilité–plasticité en organisant soigneusement son activité interne. Il stocke « l'essence » d'une règle — agir d'une manière ou d'une autre — dans un sous-espace protégé et stable, tout en laissant de la place dans d'autres sous-espaces pour accueillir de nouveaux aspects visuels et situationnels. Des tâches similaires peuvent alors être apprises rapidement en réutilisant le modèle de décision existant, tandis que des règles directement opposées exigent que le cerveau construise un nouveau motif à partir de zéro. Au-delà d'une explication de l'apprentissage efficient chez les animaux, ce travail suggère des stratégies pour concevoir des systèmes d'intelligence artificielle capables, comme le cerveau, à la fois de retenir ce qui importe et de s'adapter avec souplesse à ce qui vient ensuite.

Citation: Tian, K., Zhao, Z., Chen, Y. et al. Domain-specific schema reuse supports flexible learning to learn in the primate brain. Nat Commun 17, 2150 (2026). https://doi.org/10.1038/s41467-026-68692-x

Mots-clés: apprentissage de schéma, représentations neuronales, flexibilité cognitive, apprentissage visuomoteur, stabilité plasticité