Clear Sky Science · fr
Effets partagés de ses propres expériences et de celles des autres pendant l’apprentissage par renforcement sur la mémoire épisodique
Pourquoi regarder et agir comptent tous les deux pour la mémoire
La vie quotidienne regorge d’apprentissages issus de nos propres choix — comme tester un nouvel itinéraire pour se rendre au travail — et d’apprentissages en observant ce qui arrive aux autres — comme voir un ami recevoir une contravention pour excès de vitesse. Cette étude pose une question apparemment simple : pour former des souvenirs vivaces, est‑il vraiment important d’avoir agi soi‑même ou suffit‑il d’avoir observé quelqu’un d’autre ? Et les signaux internes de « surprise » du cerveau lors des récompenses relient‑ils agir, regarder et se souvenir de la même façon ?

Prendre des risques dans un jeu de gains et de pertes
Les chercheurs ont invité de jeunes adultes à jouer à un jeu sur ordinateur mêlant deux types d’essais. Dans certains, les participants décidaient de « jouer » pour des points ou de jouer la sécurité ; dans d’autres, ils observaient simplement un prétendu autre joueur (en réalité un modèle informatique) faire le même choix. Chaque essai montrait une taille de récompense possible suivie d’une image unique d’un objet ou d’un animal qui laissait présager la probabilité de gain. Plus tard, sans avertissement, les participants passèrent un test de mémoire : ils virent toutes les anciennes images ainsi que des images nouvelles similaires et devaient dire si chacune était ancienne ou nouvelle, et indiquer leur niveau de confiance.
Le fait d’agir soi‑même rend l’expérience plus mémorable
Lorsque l’équipe comparait la capacité des participants à distinguer les images anciennes des nouvelles, les performances étaient clairement supérieures au hasard, tant en apprenant en agissant qu’en apprenant en regardant. Autrement dit, le simple fait d’être présent dans la tâche — qu’on agisse ou qu’on observe — suffisait à former des souvenirs raisonnablement précis. Il y avait toutefois une nuance : les participants se sentaient plus confiants quant à leurs souvenirs pour les images issues des essais où ils avaient eux‑mêmes pris la décision. Même lorsque la précision objective était similaire, les souvenirs associés à ses propres choix semblaient plus forts et plus vivaces que ceux formés en regardant quelqu’un d’autre jouer.

Les choix risqués et les surprises de récompense renforcent la mémoire
Un autre volet de l’étude s’est concentré sur la façon dont le risque et la récompense façonnent le souvenir. Dans les deux modalités, agir et observer, les images présentées lors des essais où le pari était engagé étaient mieux mémorisées que celles issues des essais de « passage » sûrs. Les auteurs ont également examiné les soi‑disant erreurs de prédiction de récompense — des signaux internes qui suivent l’écart entre ce que l’on s’attend à gagner et ce que l’on est réellement susceptible d’obtenir. Lorsqu’une image indiquait une chance de récompense meilleure que prévu et que le pari était tenté, la mémoire ultérieure pour cette image était améliorée, que le choix ait été fait par le participant ou par le joueur observé. De façon frappante, des récompenses potentielles très faibles ou très élevées avaient tendance à affaiblir la mémoire, probablement parce que les personnes pouvaient décider de jouer ou de passer en se basant uniquement sur le nombre et prêtaient moins d’attention à l’image.
Observer les autres peut mobiliser le même moteur d’apprentissage
En ajustant des modèles computationnels d’apprentissage aux choix, les chercheurs ont montré que les participants mettaient à jour leurs croyances sur les probabilités de récompense d’une manière similaire lorsqu’ils agissaient et lorsqu’ils observaients. Des signaux de surprise et d’incertitude ont aidé à ajuster la rapidité avec laquelle ils apprenaient des nouveaux résultats. Fait important, le lien bénéfique entre les surprises positives de récompense pendant la présentation de l’image et la mémoire ultérieure apparaissait dans les deux modes d’apprentissage. Le jeu a aussi suscité chez beaucoup de volontaires un sentiment de compétition — ils étaient plus heureux lorsque l’autre joueur perdait que lorsqu’il gagnait — et cette compétitivité était liée à des souvenirs quelque peu plus forts dans la condition d’auto‑jeu, suggérant que la motivation et la comparaison sociale peuvent affiner sélectivement la mémoire de nos propres expériences.
Ce que cela signifie pour l’apprentissage quotidien
Pour un non‑spécialiste, le message principal est que notre système mémoriel utilise des signaux internes de « surprise » similaires quand nous apprenons de nos propres actions et quand nous apprenons en observant les autres, en particulier dans des situations impliquant risque et récompense. L’apprentissage par observation peut planter des souvenirs solides, mais agir soi‑même tend à rendre ces souvenirs plus certains et plus personnels. Dans les salles de classe, sur le lieu de travail et dans les contextes sociaux, cela implique que combiner la prise de décision active avec des occasions d’observer les autres — et veiller à ce que l’information importante apparaisse au moment où les résultats sont incertains et potentiellement meilleurs que prévu — peut être une recette efficace pour des expériences qui s’ancrent vraiment dans la mémoire.
Citation: Woitow, M.A., Jang, A.I., Eppinger, B. et al. Shared effects of one’s own and others’ experiences during reinforcement learning on episodic memory. npj Sci. Learn. 11, 16 (2026). https://doi.org/10.1038/s41539-026-00409-7
Mots-clés: apprentissage par observation, erreur de prédiction de récompense, mémoire épisodique, prise de risque, prise de décision