Clear Sky Science · pl

Konkurujące naciski poznawcze na eksplorację człowieka w braku kompromisu z eksploatacją

2026-02-12 · Powrót do spisu

Dlaczego eksplorujemy, nawet gdy nic nie jest stawką

Wyobraź sobie przewijanie recenzji restauracji lub włóczenie się po nowych ulicach miasta: eksplorujesz, ale twoje kliknięcia czy kroki nie przynoszą natychmiastowych zysków ani strat. W tym badaniu pytano, jak wygląda nasza ciekawość w takich sytuacjach o niskiej stawce i czy różni się od sposobu eksplorowania, gdy każdy wybór przynosi korzyść albo koszt. Pozbawiając eksperyment natychmiastowych nagród w starannie kontrolowanym zadaniu, autorzy ujawniają ukryte siłowania wewnątrz naszego podejmowania decyzji między dwoma rodzajami poszukiwania informacji.

Przekształcanie nagród w kolory

Większość badań laboratoryjnych nad eksploracją używa gier typu hazardowego, gdzie każdy wybór daje punkty albo pieniądze. To utrudnia rozróżnienie, czy ludzie są naprawdę ciekawi, czy po prostu gonią za wypłatami. Tu badacze zaprojektowali nowe zadanie, w którym „nagrody” były jedynie odcieniami koloru, a nie punktami. W każdej próbie ochotnicy wybierali między dwoma abstrakcyjnymi kształtami, z których każdy był powiązany z torbą produkującą przeważnie bardziej niebieskie albo bardziej pomarańczowe wyniki. Co ważne, zobaczenie koloru nie dawało ani nie zabierało od razu pieniędzy; ujawniało jedynie statystyczny wzorzec związany z tą opcją, jak poznawanie, jak zachowuje się automat do gry.

Trzy sposoby zadania tego samego pytania

Sprytny manewr polegał na utrzymaniu takiego samego doświadczenia próbkowania przy jednoczesnej zmianie tylko instrukcji i momentu pojawiania się nagród. W warunku MATCH uczestnikom powiedziano, aby zbierali docelowy kolor, a każdy wynik bliższy kolorowi docelowemu od razu przynosił punkty, naśladując klasyczne dylematy „eksploruj–wykorzystuj”. W warunku GUESS nie było celu podczas próbkowania; dopiero na końcu sekwencji uczestnicy mieli wskazać, która opcja była przeważnie niebieska lub pomarańczowa, i opłacano ich wyłącznie za tę końcową odpowiedź. Warunek FIND był pośredni: kolor docelowy był znany od początku, ale nagrody zależały wciąż jedynie od pojedynczego końcowego wyboru. W kilku niezależnych grupach zespół pokazał, że wyniki we wszystkich warunkach były zdecydowanie powyżej losowego poziomu, potwierdzając, że uczestnicy nauczyli się powiązań kolor–opcja.

Dzielenie na bloki versus gonienie niepewności

Gdy eksploracja nie konkurowała z natychmiastową nagrodą, ludzie zachowywali się w zaskakująco ustrukturyzowany sposób. W warunku GUESS zaczynali każdą nową sekwencję od wielokrotnego próbkowania tej samej opcji kilkukrotnie z rzędu, jakby chcieli uzyskać solidne pierwsze wrażenie tej opcji. Dopiero po tym „bloku” powtarzanych wyborów przełączali się i później w sekwencji zaczynali faworyzować tę opcję, która w danym momencie była bardziej niepewna. Autorzy nazywają pierwszą tendencję lokalnym minimalizowaniem niepewności: redukowaniem wątpliwości co do opcji, której właśnie dotykasz. Późniejsza tendencja to globalne minimalizowanie niepewności: celowe próbkowanie opcji, o której wiesz najmniej. Dla kontrastu, w warunku MATCH, gdzie każdy wynik miał wyraźną wartość, ludzie szybko skłaniali się ku opcji najlepiej odpowiadającej kolorowi docelowemu i znacznie rzadziej wykazywali to początkowe wzorzec dzielenia na bloki.

Zajrzeć pod maskę za pomocą modeli obliczeniowych

Aby głębiej zrozumieć te wzorce, badacze zbudowali modele matematyczne przewidujące wybory na podstawie historii obserwowanych kolorów. „Optymalny” próbkowacz, nieprzejmujący się kosztem poznawczym, zawsze wybierałby najbardziej niepewną opcję, aby zdobywać informacje tak efektywnie, jak to możliwe. Uczestnicy nie zachowywali się jak taki idealny agent. Dopasowania modeli pokazały, że oprócz umiarkowanej tendencji do gonienia niepewności, gdy nagrody były opóźnione, ludzie mieli silne uprzedzenie do powtarzania poprzedniego wyboru i często kontynuowali powtarzanie, aż osiągnęli osobisty próg pewności dotyczący danej opcji. Co ciekawe, osoby wykazujące silniejsze wczesne dzielenie na bloki często później przejawiały bardziej ukierunkowaną eksplorację i osiągały lepsze wyniki ogólnie, co sugeruje, że ta pozornie suboptymalna strategia może w praktyce być użytecznym kompromisem wobec ludzkich ograniczeń poznawczych.

Dlaczego to ma znaczenie dla codziennej ciekawości

Te ustalenia sugerują, że gdy eksplorujemy bez martwienia się o natychmiastowe zyski, dwie siły kształtują naszą ciekawość. Jedna skłania nas, by trwać przy tym, co aktualnie badamy, aby upewnić się, że naprawdę to rozumiemy; druga popycha nas w stronę tego, o czym wiemy najmniej ogólnie. W życiu codziennym przeglądanie recenzji, poznawanie nowego miasta czy testowanie nowych narzędzi prawdopodobnie odzwierciedla tę samą równowagę między lokalnym a globalnym poszukiwaniem informacji. Badanie pokazuje, że jeśli będziemy badać eksplorację tylko w zadaniach obciążonych nagrodami, ryzykujemy błędne zrozumienie tego, jak ludzie naturalnie poszukują wiedzy dla jej własnej wartości.

Cytowanie: Alméras, C., Chambon, V. & Wyart, V. Competing cognitive pressures on human exploration in the absence of trade-off with exploitation. Nat Commun 17, 883 (2026). https://doi.org/10.1038/s41467-026-68639-2

Słowa kluczowe: ludzka eksploracja, podejmowanie decyzji, niepewność, poszukiwanie informacji, modelowanie poznawcze