Clear Sky Science · fr

L’apprentissage visuel non supervisé se révèle pour des scènes naturelles non pertinentes pour la tâche en raison d’une réduction des effets de suppression attentionnelle dans les aires visuelles

2026-05-18 · Retour à l’index

Comment le cerveau apprend à partir de ce que nous voyons

Chaque jour, nos yeux captent des milliers de scènes, des rues bondées aux forêts silencieuses. Nous n’étudions pas consciemment ces vues, et pourtant, avec le temps, notre vision se calibre mieux sur le monde qui nous entoure. Cette étude pose une question simple aux conséquences surprenantes : le cerveau apprend-il automatiquement à partir de toutes les images visibles, ou seulement de certains types, et comment l’attention favorise-t-elle ou entrave-t-elle cet apprentissage caché ?

Figure 1. Les scènes naturelles reconfigurent la sensibilité visuelle même lorsqu’elles ne sont pas l’objet de l’attention.

Voir sans essayer

Les chercheurs se sont intéressés à une forme d’amélioration appelée apprentissage perceptif visuel, dans laquelle les sujets s’améliorent à juger des caractéristiques visuelles de base comme l’orientation des lignes ou la finesse des motifs. Des travaux antérieurs suggéraient que ce type d’apprentissage nécessitait souvent un retour d’information ou une attention focalisée. Mais une grande partie de l’apprentissage humain et machine est supposée non supervisée, alimentée simplement par l’exposition répétée. Pour tester si cet apprentissage passif façonne la vision, l’équipe a montré à des volontaires des images non pertinentes pour la tâche qu’ils effectuaient, puis a mesuré comment leur capacité à percevoir des détails fins avait évolué.

Scènes naturelles versus motifs artificiels

Les participants réalisaient une tâche exigeante de lettres et de chiffres au centre de l’écran tandis qu’en arrière-plan ils voyaient soit des scènes naturelles, soit des images artificielles soigneusement conçues. Les scènes naturelles ressemblaient à des forêts, des paysages urbains ou d’autres vues du monde réel, riches en arêtes, textures et contours. Les images artificielles étaient construites pour correspondre à certaines propriétés simples des scènes naturelles, comme la luminosité globale, l’orientation des lignes et la fréquence spatiale, mais elles étaient brouillées de sorte que la structure porteuse de sens était supprimée. Après plusieurs jours d’exposition, les sujets ont été testés sur leur capacité à discriminer l’orientation des lignes ou la rugosité des motifs à l’aide d’images de test neutres.

Quand le cerveau apprend et quand il n’apprend pas

Les résultats furent frappants. Lorsque les images étaient simplement regardées sans tâche centrale, les scènes naturelles comme les images artificielles entraînaient une amélioration de la sensibilité visuelle, montrant que l’apprentissage non supervisé est possible en principe. Cependant, lorsque l’attention était accaparée par la tâche centrale exigeante, seules les scènes naturelles produisaient des gains durables. Les images artificielles, même bien visibles et appariées sur des statistiques simples, n’engendraient aucune amélioration. Des expériences supplémentaires ont disséqué les images selon différents types de structure statistique. L’apprentissage apparaissait dès que les images non pertinentes contenaient des relations complexes de haut niveau entre arêtes et textures, et disparaissait lorsque seules des composantes simples de bas niveau étaient présentes.

Attention et structure cachée des images

Pour comprendre ce qui se passait dans le cerveau, l’équipe a combiné tests comportementaux et imagerie cérébrale. Ils ont constaté que les systèmes attentionnels des régions pariétales et frontales envoyaient des signaux de suppression similaires quel que soit le type d’image. Pourtant, les profils d’activité dans les aires visuelles supérieures, au-delà du cortex visuel primaire, étaient moins atténués pour les images porteuses de structure de haut niveau que pour les images plus simples. Des expériences temporelles supplémentaires ont montré que le cerveau met plus de temps à extraire ces relations complexes des scènes naturelles qu’à traiter des motifs simples. Comme la suppression top-down décroît dans une fenêtre temporelle limitée, les signaux plus lents et plus complexes peuvent émerger après le passage de la suppression la plus forte, permettant à l’apprentissage non supervisé de s’installer.

Ce que cela signifie pour la vision quotidienne

En termes simples, l’étude suggère que le cerveau est constamment prêt à apprendre de ce que nous voyons sans instruction, mais que cet apprentissage est filtré. Lorsque notre attention est fortement focalisée sur une tâche, les motifs simples et artificiels en arrière-plan sont effectivement mis en sourdine et laissent peu de traces. Les scènes naturelles, avec leur riche réseau de relations entre arêtes et textures, sont plus difficiles à supprimer et peuvent néanmoins remodeler notre perception, même lorsque nous ne leur prêtons pas attention. Ce travail met en avant l’apprentissage non supervisé comme un moteur fondamental de l’amélioration visuelle, dont l’impact dépend à la fois de la structure cachée de ce que nous regardons et de la manière dont l’attention verrouille l’information à travers le système visuel.

Figure 2. Les motifs d’images complexes contournent les filtres attentionnels forts et induisent des changements dans les aires visuelles cérébrales.

Citation: Watanabe, T., Sasaki, Y., Zama, T. et al. Unsupervised visual learning is revealed for task-irrelevant natural scenes due to reduced attentional suppression effects in visual areas. Nat Commun 17, 4232 (2026). https://doi.org/10.1038/s41467-026-72918-3

Mots-clés: apprentissage visuel, scènes naturelles, attention, apprentissage perceptif, IRMf