Clear Sky Science · sv
Motstridiga kognitiva krafter vid mänsklig utforskning när det inte finns någon avvägning gentemot exploatering
Varför vi utforskar, även när inget står på spel
Föreställ dig att skrolla restaurangrecensioner eller vandra i nya kvarter i en stad: du utforskar, men dina klick eller steg vinner eller förlorar dig ingenting omedelbart. Denna studie frågar hur vår nyfikenhet tar sig uttryck i sådana låginsatsmiljöer, och om den skiljer sig från hur vi utforskar när varje val ger utdelning eller kostar oss något. Genom att ta bort omedelbara belöningar i ett noggrant kontrollerat experiment blottlägger författarna dolda dragkamper i vårt beslutsfattande mellan två slags informationssökande.
Att förvandla belöningar till färger
De flesta laborationsstudier av utforskning använder spel-liknande uppgifter där varje val ger poäng eller pengar. Det gör det svårt att avgöra om människor är genuint nyfikna eller bara jagar utdelning. Här konstruerade forskarna en ny uppgift där ”belöningarna” bara var nyanser av färg, inte poäng. I varje försök valde försökspersoner mellan två abstrakta former, var och en kopplad till en påse som gav övervägande blåaktiga eller övervägande orangeaktiga utfall. Viktigt är att att se en färg inte omedelbart gav eller tog bort pengar; i stället avslöjade det bara det statistiska mönstret bakom det alternativet, ungefär som att lära sig hur en spelautomat tenderar att bete sig. 
Tre sätt att ställa samma fråga
Den smarta vridningen var att hålla provtagningserfarenheten densamma samtidigt som man bara ändrade instruktionerna och när belöningar utbetalades. I MATCH‑villkoret fick deltagarna i uppdrag att samla en målfärg, och varje utfall som mer matchade målet gav poäng direkt, vilket efterliknade klassiska ”utforska–exploatera”-dilemman. I GUESS‑villkoret fanns inget mål under provtagningen; först i slutet av sekvensen ombads deltagarna ange vilket alternativ som mestadels var blått respektive orange, och de belönades enbart för det slutgiltiga svaret. FIND‑villkoret låg mitt emellan: målfärgen var känd från början, men belöningarna berodde ändå endast på ett enda slutligt val. I flera oberoende grupper visade teamet att prestandan i alla villkor låg långt över slumpnivå, vilket bekräftar att deltagarna lärde sig färg–alternativ‑kopplingarna.
Chunkning kontra att jaga osäkerhet
När utforskning inte konkurrerade med omedelbar belöning uppträdde människor på ett förvånansvärt strukturerat sätt. I GUESS‑villkoret inledde de varje ny sekvens med att upprepade gånger provta samma alternativ flera gånger i följd, som om de ville få ett stabilt första intryck av just det. Först efter detta ”chunk” av upprepade val bytte de och, senare i sekvensen, började gynna vilket alternativ som för närvarande var mest osäkert. Författarna kallar den första tendensen lokal osäkerhetsminimering: minska tvivel om det alternativ du för närvarande undersöker. Den senare tendensen är global osäkerhetsminimering: medvetet provta det alternativ vars beteende du vet minst om i stort. I kontrast drog deltagarna i MATCH‑villkoret, där varje utfall hade tydligt värde, snabbt mot det alternativ som bäst matchade målfärgen och visade betydligt mindre av detta inledande chunk‑mönster. 
En titt under huven med beräkningsmodeller
För att förstå dessa mönster djupare byggde forskarna matematiska modeller som förutsäger val utifrån historiken av observerade färger. En ”optimal” provtagare, oberörd av mental ansträngning, skulle alltid välja det mest osäkra alternativet för att skaffa information så effektivt som möjligt. Mänskliga deltagare uppförde sig inte som denna idealagent. Modellpassningar visade att, utöver en modest tendens att jaga osäkerhet när belöningar fördröjdes, hade människor en stark bias att upprepa sitt föregående val och i många fall fortsätta upprepa tills de nått en personlig konfidensgräns för det alternativet. Intressant nog tenderade individer som visade starkare tidig chunkning ofta också att visa mer riktad utforskning senare och presterade bättre totalt, vilket tyder på att denna til synes suboptimala strategi faktiskt kan vara ett användbart kompromissbeteende givet mänskliga kognitiva begränsningar.
Varför detta spelar roll för vardagsnyfikenhet
Dessa fynd tyder på att när vi utforskar utan att oroa oss för omedelbar belöning formas vår nyfikenhet av två krafter. Den ena får oss att stanna vid det vi för tillfället undersöker för att försäkra oss om att vi verkligen förstår det; den andra puffar oss mot det vi överlag vet minst om. I verkliga livet—när vi bläddrar recensioner, lär oss en ny stad eller testar nya verktyg—reflekterar beteendet sannolikt samma balans mellan lokalt och globalt informationssökande. Studien visar att om vi endast studerar utforskning i belöningsfyllda uppgifter riskerar vi missförstå hur människor naturligt söker kunskap för dess egen skull.
Citering: Alméras, C., Chambon, V. & Wyart, V. Competing cognitive pressures on human exploration in the absence of trade-off with exploitation. Nat Commun 17, 883 (2026). https://doi.org/10.1038/s41467-026-68639-2
Nyckelord: mänsklig utforskning, beslutsfattande, osäkerhet, informationssökande, kognitiv modellering