Clear Sky Science · it
Pressioni cognitive contrastanti sull’esplorazione umana in assenza di trade-off con lo sfruttamento
Perché esploriamo, anche quando non c’è nulla in gioco
Immagina di scorrere le recensioni di ristoranti o di vagare per strade nuove in una città: stai esplorando, ma i tuoi clic o i tuoi passi non ti fanno guadagnare o perdere nulla immediatamente. Questo studio indaga che aspetto ha la nostra curiosità in contesti a basso rischio e se differisce da come esploriamo quando ogni scelta ha una ricompensa o un costo. Eliminando le ricompense immediate in un esperimento controllato, gli autori mettono in luce le tug‑of‑wars nascoste nel nostro processo decisionale fra due tipi di ricerca di informazioni.
Trasformare le ricompense in colori
La maggior parte degli studi di laboratorio sull’esplorazione usa giochi in stile scommessa in cui ogni scelta dà punti o denaro. Così è difficile stabilire se le persone siano davvero curiose o semplicemente alla ricerca di guadagni. Qui, i ricercatori hanno progettato un nuovo compito in cui le “ricompense” erano solo tonalità di colore, non punti. In ogni prova i volontari sceglievano fra due forme astratte, ognuna collegata a un sacchetto che produceva prevalentemente esiti tendenti al blu o all’arancio. È importante sottolineare che vedere un colore non dava né toglieva denaro: rivelava soltanto il pattern statistico dietro quell’opzione, come capire il comportamento tipico di una slot machine. 
Tre modi per porre la stessa domanda
La trovata intelligente è stata mantenere l’esperienza di campionamento identica cambiando solo le istruzioni e il momento in cui apparivano le ricompense. Nella condizione MATCH, ai partecipanti veniva detto di raccogliere un colore bersaglio e ogni risultato più vicino al colore bersaglio fruttava punti subito, emulando i classici dilemmi “esplora–sfrutta”. Nella condizione GUESS non c’era un bersaglio durante il campionamento; solo alla fine della sequenza veniva chiesto ai soggetti quale opzione fosse per lo più blu o arancione, e venivano pagati soltanto per quella risposta finale. La condizione FIND stava a metà: il colore bersaglio era noto fin dall’inizio, ma le ricompense dipendevano comunque solo da una scelta finale. Attraverso diversi gruppi indipendenti, il team ha mostrato che le prestazioni in tutte le condizioni erano ben al di sopra del caso, confermando che i partecipanti avevano appreso l’associazione colore–opzione.
Chunking contro inseguire l’incertezza
Quando l’esplorazione non competeva con una ricompensa immediata, le persone si comportavano in modo sorprendentemente strutturato. Nella condizione GUESS cominciavano ogni nuova sequenza campionando ripetutamente la stessa opzione più volte di seguito, come se volessero ottenere una solida prima impressione di quella. Solo dopo questo “blocco” di scelte ripetute cambiavano e, più avanti nella sequenza, iniziavano a preferire l’opzione che in quel momento era complessivamente più incerta. Gli autori definiscono la prima tendenza minimizzazione dell’incertezza locale: ridurre il dubbio sull’opzione che si sta esaminando in quel momento. La tendenza successiva è minimizzazione dell’incertezza globale: campionare deliberatamente l’opzione di cui si sa meno. Al contrario, nella condizione MATCH, dove ogni esito aveva un valore chiaro, le persone si orientavano rapidamente verso l’opzione che meglio corrispondeva al colore bersaglio e manifestavano molto meno questo schema iniziale di chunking. 
Guardare sotto il cofano con modelli computazionali
Per comprendere più a fondo questi schemi, i ricercatori hanno costruito modelli matematici che prevedono le scelte a partire dalla storia dei colori osservati. Un campionatore “ottimale”, indifferente al costo mentale, sceglierebbe sempre l’opzione più incerta per raccogliere informazioni nel modo più efficiente possibile. I partecipanti umani non si comportavano come questo agente ideale. I fit dei modelli hanno mostrato che, oltre a una modesta tendenza a inseguire l’incertezza quando le ricompense erano ritardate, le persone avevano un forte bias a ripetere la scelta precedente e, in molti casi, a continuare a ripetere finché non raggiungevano una soglia personale di confidenza su quell’opzione. Interessante è che gli individui che mostravano un chunking iniziale più marcato tendevano spesso anche a un’esplorazione più diretta in seguito e ottenevano prestazioni complessive migliori, suggerendo che questa strategia apparentemente subottimale può in realtà essere un compromesso utile dati i limiti cognitivi umani.
Perché questo conta per la curiosità di tutti i giorni
Questi risultati suggeriscono che quando esploriamo senza preoccuparci dei guadagni immediati, due forze plasmano la nostra curiosità. Una ci spinge a restare su ciò che stiamo esaminando, per assicurarci di capirlo davvero; l’altra ci indirizza verso ciò di cui sappiamo meno nel complesso. Nella vita reale, consultare recensioni, imparare una nuova città o provare nuovi strumenti riflette probabilmente lo stesso equilibrio tra ricerca di informazioni locale e globale. Lo studio mostra che se studiamo l’esplorazione solo in compiti ricchi di ricompense rischiamo di fraintendere come le persone cercano naturalmente conoscenza per il gusto di farlo.
Citazione: Alméras, C., Chambon, V. & Wyart, V. Competing cognitive pressures on human exploration in the absence of trade-off with exploitation. Nat Commun 17, 883 (2026). https://doi.org/10.1038/s41467-026-68639-2
Parole chiave: esplorazione umana, presa di decisione, incertezza, ricerca di informazioni, modellizzazione cognitiva