Clear Sky Science · fr

Généralisation cognitive de type humain pour les grands modèles via une supervision guidée par les représentations mentales

2026-04-01 · Retour à l’index

Pourquoi il est important d’apprendre à l’IA à penser comme nous

L’intelligence artificielle moderne sait reconnaître des visages, étiqueter des photos et rédiger des textes fluides, mais elle peine encore à atteindre le type de compréhension flexible que les humains utilisent au quotidien. Nous pouvons voir un oiseau et reconnaître ensuite de nombreuses espèces, ou comprendre que un hamac et une poussette impliquent tous deux de s’allonger pour se reposer. Cet article explore une nouvelle manière d’aider les modèles informatiques à se rapprocher de cette forme de raisonnement humain en utilisant directement l’activité cérébrale comme signal d’apprentissage.

Les limites des machines intelligentes d’aujourd’hui

Les systèmes d’apprentissage profond standard deviennent plus performants principalement en augmentant leur taille et la quantité de données d’entraînement. Cette recette fonctionne bien pour des tâches concrètes comme reconnaître des chaussettes, des cygnes ou des voitures sur des images. Cependant, les auteurs montrent que l’ajout pur et simple de paramètres au modèle apporte peu d’amélioration pour saisir des idées abstraites telles que les vêtements, les oiseaux, ou la distinction plus générale entre les êtres vivants et les objets non vivants. Lorsqu’on a évalué les modèles sur des tâches d’apprentissage en un seul exemple, ils se sont nettement améliorés sur des objets spécifiques en grandissant, mais ont à peine progressé, voire décliné, sur des catégories de niveau supérieur. Des analyses de la manière dont les modèles séparent les concepts en interne ont révélé que, contrairement au cerveau humain, ils ne regroupaient pas naturellement les êtres vivants à part des outils et autres objets.

Figure 1. Comment les motifs cérébraux peuvent apprendre à l’IA à regrouper et comprendre les objets plus comme le font les humains.

Laisser le cerveau guider la machine

Pour combler cette lacune, les chercheurs ont conçu ce qu’ils appellent une supervision guidée par les représentations mentales. Des volontaires ont été placés dans un appareil d’imagerie cérébrale pendant qu’ils visionnaient de nombreuses images naturelles. À partir de ces enregistrements, l’équipe a extrait des motifs d’activité dans des zones du cortex visuel connues pour encoder des informations de haut niveau et riches sur ce que nous voyons. Parallèlement, un réseau artificiel traitait les mêmes images. L’idée clé était de forcer la structure interne des similarités et des différences entre objets du réseau à s’aligner sur la structure observée dans le cerveau. Les auteurs ont traité le cerveau et le modèle comme des graphes de concepts interconnectés et ont utilisé une procédure itérative d’appariement de graphes pour les rapprocher.

Le comportement des modèles alignés sur le cerveau

Après cet entraînement particulier, les modèles n’ont pas simplement mémorisé les images supervisées. Ils ont développé une carte de concepts plus proche de celle des humains qui se généralise à de nombreux nouveaux objets jamais appariés avec des données cérébrales. Les modèles améliorés sont devenus bien meilleurs en apprentissage en un seul exemple pour des catégories abstraites, montrant des regroupements plus serrés pour des concepts comme animal, véhicule ou instrument de musique. Leurs hiérarchies internes en sont venues à ressembler à WordNet, une base de données construite manuellement représentant les relations entre mots anglais, bien que les modèles n’aient jamais été explicitement entraînés sur cette structure. Lorsqu’on leur demandait de choisir « l’intrus » parmi trois images, les modèles guidés par le cerveau faisaient des choix qui correspondaient davantage aux jugements humains recueillis en grand nombre. Ils se sont aussi révélés plus difficiles à tromper avec de petites distorsions d’image soigneusement conçues, suggérant une compréhension plus profonde et plus robuste des objets.

Une fenêtre sur un espace conceptuel plus humain

Les auteurs sont allés plus loin et ont examiné le « variété conceptuelle », ou carte de faible dimension, qui sous-tend les modèles guidés par le cerveau. En se déplaçant dans cette carte et en décodant des points en descriptions en langage naturel, ils ont montré que des positions proches correspondaient à des idées sémantiquement liées, comme différents types de vêtements ou de véhicules. L’interpolation entre régions produisait des transitions lisses, par exemple en glissant des appareils électroniques vers des animaux et en aboutissant à des chevaux lorsqu’on traversait la zone entre véhicules et mammifères ongulés. Le système pouvait aussi résumer plusieurs images apparentées en une seule phrase significative et effectuer une simple « arithmétique conceptuelle », ajustant des légendes en ajoutant ou en soustrayant des éléments comme cheval ou moto d’une manière en accord avec l’intuition humaine.

Figure 2. Comment l’alignement de l’IA sur l’activité cérébrale remodèle son fonctionnement interne pour mieux gérer les catégories abstraites et les nouvelles situations.

Ce que cela signifie pour l’IA future

En termes concrets, ce travail suggère que donner aux systèmes d’IA une impulsion issue du cerveau humain peut les aider à dépasser le simple appariement de motifs pour approcher notre manière d’organiser les connaissances. Plutôt que de se contenter d’agrandir les modèles, l’étude montre que façonner leur espace conceptuel interne pour qu’il reflète la structure cérébrale peut améliorer leur capacité à traiter des situations nouvelles, abstraites et inhabituelles. Bien que l’approche dépende encore de scans cérébraux détaillés de personnes individuelles, l’expansion d’un tel entraînement informé par le cerveau pourrait conduire à des systèmes artificiels plus adaptables, plus interprétables et mieux alignés sur la façon dont les humains perçoivent et raisonnent sur le monde.

Citation: Chen, J., Qi, Y., Wang, Y. et al. Human-like cognitive generalization for large models via mental representation-guided supervision. Nat Commun 17, 4709 (2026). https://doi.org/10.1038/s41467-026-71267-5

Mots-clés: apprentissage guidé par le cerveau, concepts abstraits, réseaux neuronaux profonds, hiérarchie des concepts, généralisation cognitive