Clear Sky Science · it
L’incertezza e le storie di ricompensa hanno effetti distinti sulle decisioni dopo vittorie e sconfitte
Perché vittorie e sconfitte non ci insegnano allo stesso modo
Ogni giorno prendiamo decisioni basate su vittorie e sconfitte passate, dal scegliere un’azione in borsa al selezionare il percorso per andare al lavoro. Eppure esseri umani e animali apprendono notoriamente più dal successo che dall’insuccesso. Questo articolo esplora perché questo squilibrio non è soltanto una stranezza, ma una strategia adattativa modellata dal modo in cui il nostro cervello tiene traccia della storia delle ricompense e dell’incertezza. Studiando ratti in un ambiente variabile e parzialmente imprevedibile, i ricercatori scoprono regole nascoste che determinano quando le vittorie pesano più delle sconfitte — e come queste regole differiscano tra maschi e femmine.

Un mondo che cambia per ratti assetati
Per sondare queste regole, il gruppo ha addestrato ratti con accesso all’acqua limitato a un compito di scelta dinamico. In ogni prova i ratti avviavano un turno e poi scelgono tra due leve. Una leva aveva una probabilità maggiore di erogare una goccia d’acqua zuccherata, ma quale leva fosse “migliore” e di quanto cambiava a blocchi durante la sessione. Alcuni blocchi rendevano la leva migliore molto evidente (un lato premiava la maggior parte delle volte, l’altro quasi mai), mentre altri blocchi erano più confusi, con probabilità di ricompensa più vicine o addirittura uguali sulle due leve. Questa impostazione in costante mutamento imita la vita reale, dove ciò che funzionava ieri potrebbe non funzionare oggi.
Seguire i vincenti, ignorare alcune sconfitte
Su centinaia di sessioni, i ratti tendevano a ripetere una scelta dopo una vittoria («win-stay») più spesso di quanto cambiassero dopo una sconfitta («lose-shift»). Ciò confermava un forte orientamento all’apprendimento dal successo. Il modello era particolarmente chiaro una volta che i ratti avevano tempo, all’interno di un blocco, per capire quale leva era di solito migliore. In queste prove successive, non solo restavano più spesso dopo le vittorie, ma erano anche meno inclini ad abbandonare la leva migliore dopo una sconfitta rara. Questa strategia li aiutava a continuare a sfruttare l’opzione più redditizia invece di essere fuorviati dall’occasione negativa che può capitare anche con una buona scelta. I maschi mostrarono questo bias in modo più marcato rispetto alle femmine: erano più propensi a restare dopo le vittorie e meno inclini a cambiare dopo le sconfitte.
Segnali nascosti: incertezza e storia delle ricompense
Per comprendere i calcoli invisibili dietro questo comportamento, gli autori hanno usato modelli di apprendimento per rinforzo — algoritmi computazionali che aggiornano le aspettative in base al feedback. Si sono concentrati su due segnali interni. Il primo era una misura di «storia dell’incertezza»: una media dei livelli recenti di sorpresa, che cattura quanto siano stati imprevedibili gli esiti. Quando questo numero era alto, l’ambiente era effettivamente più torbido. Il secondo era uno «stato globale di ricompensa», un riassunto smussato di quanto l’ambiente recente fosse stato ricco o povero di ricompense. Insieme, questi segnali permettevano ai ratti di stimare sia quanto rumoroso fosse il mondo sia come fossero andate le cose ultimamente, e di regolare quanto peso assegnare all’ultima vittoria o sconfitta.

Quando imprevedibilità e abbondanza plasmano le scelte
I due segnali interni influenzavano il comportamento in modi distinti e talvolta specifici per sesso. I ratti erano più propensi a restare dopo una vittoria e meno inclini ad abbandonare la leva migliore quando l’incertezza era bassa — cioè quando il modello dell’ambiente era più chiaro. In condizioni di alta incertezza, erano più portati a cambiare via da una buona leva dopo una sconfitta, suggerendo che situazioni confusing possono innescare comportamenti più cauti. Nel frattempo, uno stato globale di ricompensa elevato, che rifletteva una serie generalmente positiva di esiti, incoraggiava i ratti a continuare a restare dopo le vittorie e riduceva la loro tendenza a cambiare dopo le sconfitte, anche quando l’ambiente era alquanto rumoroso. Le decisioni basate sulle vittorie dei maschi erano particolarmente modellate dalla loro storia di incertezza, mentre le femmine facevano più affidamento in modo consistente sullo stato globale di ricompensa.
Cosa significa per le decisioni quotidiane
Per un lettore non specialista, il messaggio centrale è che «imparare più dalle vittorie che dalle sconfitte» non è semplicemente essere troppo ottimisti. Lo studio mostra che i ratti — e probabilmente gli esseri umani — regolano dinamicamente quanto ascoltare vittorie e sconfitte in base a quanto prevedibile e quanto gratificante il loro mondo è sembrato di recente. Quando le regole sembrano chiare e le ricompense sono abbondanti, può essere intelligente fidarsi delle vittorie e scontare i fallimenti occasionali. Quando le cose appaiono caotiche o scarse, dare più peso alle sconfitte può aiutare a evitare scelte sbagliate. Il lavoro rivela anche che maschi e femmine possono seguire le stesse regole del compito utilizzando bilanci interni leggermente diversi di incertezza e storia delle ricompense, un’intuizione che può contribuire a spiegare differenze di sesso nella vulnerabilità a condizioni come dipendenza o depressione, dove l’apprendimento da ricompensa e punizione si altera.
Citazione: Kalhan, S., Magnard, R., Zhang, Z. et al. Uncertainty and reward histories have distinct effects on decisions after wins and losses. Sci Rep 16, 6795 (2026). https://doi.org/10.1038/s41598-026-37554-3
Parole chiave: apprendimento per rinforzo, presa di decisione, incertezza, storia delle ricompense, differenze di sesso