Clear Sky Science · fr

Les historiques d’incertitude et de récompense ont des effets distincts sur les décisions après gains et pertes

2026-01-31 · Retour à l’index

Pourquoi les gains et les pertes ne nous apprennent pas de la même manière

Chaque jour, nous prenons des décisions fondées sur des gains et des pertes passés, qu’il s’agisse de choisir une action ou un itinéraire pour aller au travail. Pourtant, les humains et les animaux apprennent classiquement davantage des succès que des échecs. Cet article explore pourquoi ce déséquilibre n’est pas qu’une bizarrerie mais une stratégie adaptative façonnée par la manière dont notre cerveau suit l’historique des récompenses et l’incertitude. En étudiant des rats dans un environnement changeant et partiellement imprévisible, les chercheurs mettent au jour des règles cachées qui déterminent quand les gains comptent plus que les pertes — et comment ces règles diffèrent entre mâles et femelles.

Un monde changeant pour des rats assoiffés

Pour sonder ces règles, l’équipe a entraîné des rats privés d’eau à une tâche de choix dynamique. À chaque essai, les rats déclenchaient un tour, puis choisissaient entre deux leviers. Un levier avait plus de chances de délivrer une goutte d’eau sucrée, mais lequel était « meilleur » et à quel point il l’était changeait par blocs au cours de la session. Certains blocs rendaient le levier meilleur très évident (un côté rapportait la plupart du temps, l’autre presque jamais), tandis que d’autres blocs étaient plus confus, avec des probabilités de récompense proches voire égales entre les deux leviers. Ce dispositif en perpétuel changement imite la vie réelle, où ce qui fonctionnait hier peut ne pas fonctionner aujourd’hui.

S’accrocher aux gagnants, relativiser certaines pertes

Au fil de centaines de sessions, les rats avaient tendance à répéter un choix après un gain (« stay après gain ») plus souvent qu’ils ne changeaient après une perte (« shift après perte »). Cela confirmait une forte inclination à apprendre du succès. Le schéma était particulièrement marqué une fois que les rats disposaient de temps, au sein d’un bloc, pour identifier quel levier était généralement meilleur. Lors de ces essais ultérieurs, ils restaient non seulement davantage après un gain, mais abandonnaient aussi moins le levier meilleur après une perte rare. Cette stratégie les aidait à continuer d’exploiter l’option la plus rémunératrice au lieu d’être égarés par un mauvais résultat occasionnel qui peut survenir même après un bon choix. Les mâles présentaient ce biais plus fortement que les femelles : ils étaient plus susceptibles de rester après un gain et moins enclins à changer après une perte.

Signaux cachés : incertitude et historique de récompense

Pour comprendre les calculs invisibles sous-jacents à ce comportement, les auteurs ont utilisé des modèles d’apprentissage par renforcement — des algorithmes informatiques qui mettent à jour les attentes en fonction des retours. Ils se sont concentrés sur deux signaux internes. Le premier était une mesure d’« historique d’incertitude » : une moyenne des niveaux récents de surprise, capturant à quel point les résultats avaient été imprévisibles. Quand ce chiffre était élevé, l’environnement était effectivement plus trouble. Le second était un « état global de récompense », un résumé lissé de la richesse ou de la pauvreté ressentie par l’environnement récent. Ensemble, ces signaux permettaient aux rats d’estimer à la fois le degré de bruit du monde et la qualité des résultats récents, et d’ajuster le poids accordé au gain ou à la perte les plus récents.

Quand imprévisibilité et abondance façonnent les choix

Les deux signaux internes influençaient le comportement de façon distincte et parfois spécifique au sexe. Les rats avaient davantage tendance à rester après un gain et moins à abandonner le levier meilleur lorsque l’incertitude était faible — c’est‑à‑dire lorsque le schéma de l’environnement était plus clair. En situation d’incertitude élevée, ils étaient plus enclins à se détourner d’un bon levier après une perte, ce qui suggère que des conditions confuses peuvent déclencher un comportement plus prudent. Parallèlement, un état global de récompense élevé, reflétant une longue série de bons résultats, encourageait les rats à continuer de rester après des gains et réduisait leur tendance à changer après des pertes, même lorsque l’environnement était quelque peu bruyant. Les décisions basées sur les gains des mâles étaient particulièrement modulées par leur historique d’incertitude, tandis que les femelles s’appuyaient de façon plus consistante sur l’état global de récompense.

Ce que cela signifie pour les décisions quotidiennes

Pour le grand public, le message central est que « apprendre davantage des gains que des pertes » n’est pas simplement de l’optimisme excessif. L’étude montre que les rats — et probablement les humains — ajustent dynamiquement la façon dont ils écoutent les gains et les pertes en fonction de la prévisibilité et de l’abondance ressenties récemment. Quand les règles semblent claires et que les récompenses abondent, il peut être judicieux de faire confiance aux gains et d’écarter les échecs occasionnels. Quand les choses paraissent chaotiques ou maigres, accorder davantage d’importance aux pertes peut aider à éviter de mauvais choix. Le travail révèle aussi que mâles et femelles peuvent suivre les mêmes règles de tâche en utilisant des équilibres internes légèrement différents entre incertitude et historique de récompense, un aperçu qui peut aider à expliquer les différences liées au sexe dans la vulnérabilité à des troubles comme l’addiction ou la dépression, où l’apprentissage à partir de la récompense et de la punition se dérègle.

Citation: Kalhan, S., Magnard, R., Zhang, Z. et al. Uncertainty and reward histories have distinct effects on decisions after wins and losses. Sci Rep 16, 6795 (2026). https://doi.org/10.1038/s41598-026-37554-3

Mots-clés: apprentissage par renforcement, prise de décision, incertitude, historique de récompense, différences liées au sexe