Clear Sky Science · sv

Osäkerhet och belöningshistorik påverkar beslut olika efter vinster och förluster

· Tillbaka till index

Varför vinster och förluster inte lär oss lika mycket

Varje dag fattar vi val utifrån tidigare vinster och förluster, från att välja en aktie till att välja väg till jobbet. Ändå lär sig människor och djur ofta mer av framgång än av misslyckande. Den här artikeln undersöker varför den obalansen inte bara är en nyckfullhet utan en adaptiv strategi formad av hur våra hjärnor spårar belöningshistorik och osäkerhet. Genom att studera råttor i en föränderlig, delvis oförutsägbar miljö, avslöjar forskarna dolda regler som avgör när vinster spelar större roll än förluster — och hur de reglerna skiljer sig mellan hannar och honor.

Figure 1
Figure 1.

En föränderlig värld för törstiga råttor

För att undersöka dessa regler tränade teamet vattenbegränsade råttor i en dynamisk valuppgift. I varje försök satte råttorna igång en omgång och valde mellan två spakar. En spak hade större sannolikhet att ge en droppe sockrat vatten, men vilken spak som var ”bättre” och hur mycket bättre ändrade sig i block genom sessionen. Vissa block gjorde den bättre spaken mycket uppenbar (den ena sidan gav utdelning oftast, den andra nästan aldrig), medan andra block var mer förvirrande, med närmare eller till och med lika stora chanser till belöning på de två spakarna. Denna ständigt skiftande uppsättning efterliknar verkliga livet, där det som fungerade igår kanske inte fungerar idag.

Hålla fast vid vinnare, nonchalera vissa förluster

I hundratals sessioner tenderade råttorna att upprepa ett val efter en vinst (”win-stay”) oftare än att byta efter en förlust (”lose-shift”). Det bekräftade en stark lutning mot att lära av framgång. Mönstret var särskilt tydligt när råttorna fått tid inom ett block att lista ut vilken spak som vanligen var bättre. I dessa senare försök stannade de inte bara mer efter vinster utan var också mindre benägna att överge den bättre spaken efter en sällsynt förlust. Denna strategi hjälpte dem att fortsätta exploatera det mest belönande alternativet i stället för att luras av den tillfälliga dåliga utkomsten som kan inträffa även vid ett bra val. Hannar visade denna tendens starkare än honor: de var mer benägna att stanna efter vinster och mindre benägna att byta efter förluster.

Dolda signaler: osäkerhet och belöningshistorik

För att förstå de osynliga beräkningarna bakom detta beteende använde författarna förstärkningsinlärningsmodeller — datoralgoritmer som uppdaterar förväntningar baserat på feedback. De fokuserade på två interna signaler. Den första var ett mått på ”osäkerhetshistorik”: ett genomsnitt av nyliga nivåer av överraskning som fångar hur oförutsägbara utfallen varit. När detta tal var högt var miljön i praktiken mer dunkel. Den andra var ett ”globalt belöningsläge”, en utjämnad sammanfattning av hur rik eller fattig den senaste miljön kändes i stort. Tillsammans tillät dessa signaler råttorna att uppskatta både hur bullrigt världen var och hur bra det gått på sistone, och att justera hur mycket vikt de skulle ge en ny vinst eller förlust.

Figure 2
Figure 2.

När oförutsägbarhet och rikedom formar val

De två interna signalerna påverkade beteendet på skilda och ibland kösspecifika sätt. Råttorna var mer benägna att stanna efter en vinst och mindre benägna att överge den bättre spaken när osäkerheten var låg — det vill säga när miljöns mönster var klarare. Under hög osäkerhet var de mer benägna att byta bort från en bra spak efter en förlust, vilket tyder på att förvirrande förhållanden kan utlösa mer försiktigt beteende. Samtidigt uppmuntrade ett högt globalt belöningsläge, som speglade en allmänt gynnsam period av utfall, råttorna att fortsätta stanna efter vinster och minskade deras tendens att byta efter förluster, även när miljön var något bullrig. Hannarnas vinstbaserade beslut påverkades särskilt av deras osäkerhetshistorik, medan honor förlitade sig mer konsekvent på det övergripande belöningsläget.

Vad detta betyder för vardagsbeslut

För en lekman är huvudbudskapet att ”lära mer av vinster än förluster” inte helt enkelt ett tecken på överdriven optimism. Studien visar att råttor — och sannolikt människor — dynamiskt justerar hur mycket de lyssnar på vinster och förluster beroende på hur förutsägbar och hur belönande deras värld känts nyligen. När reglerna verkar tydliga och belöningarna är rikliga kan det vara klokt att lita på vinster och bortse från enstaka misslyckanden. När saker känns kaotiska eller knappa kan det hjälpa att ge större vikt åt förluster för att undvika dåliga val. Arbetet visar också att hannar och honor kan följa samma uppgiftsregler med något olika interna balansgångar mellan osäkerhet och belöningshistorik, en insikt som kan bidra till att förklara könsskillnader i sårbarhet för tillstånd som beroende eller depression, där lärande från belöning och bestraffning störs.

Citering: Kalhan, S., Magnard, R., Zhang, Z. et al. Uncertainty and reward histories have distinct effects on decisions after wins and losses. Sci Rep 16, 6795 (2026). https://doi.org/10.1038/s41598-026-37554-3

Nyckelord: förstärkningsinlärning, beslutsfattande, osäkerhet, belöningshistorik, könsskillnader