Clear Sky Science · ru
Соперничающие когнитивные давления на человеческое исследование при отсутствии компромисса с эксплуатацией
Почему мы исследуем, даже когда ничего не поставлено на карту
Представьте, что вы просматриваете отзывы о ресторанах или бродите по новым улицам города: вы исследуете, но ваши клики или шаги здесь и сейчас ничего не выигрывают и не теряют. В этом исследовании задаются вопросом, как выглядит наше любопытство в таких ситуациях с низкой ставкой и отличается ли оно от того, как мы исследуем, когда каждый выбор приносит выигрыш или убыток. Устранив немедленные вознаграждения в тщательно контролируемом эксперименте, авторы выявляют скрытые внутренние противоречия в принятии решений между двумя типами поиска информации.
Преобразование вознаграждений в цвета
Большинство лабораторных исследований исследования используют игровые задачи в стиле азартных игр, где каждый выбор приносит очки или деньги. Это затрудняет понимание того, вызвано ли поведение истинным любопытством или простым преследованием выгоды. Здесь исследователи разработали новую задачу, в которой «вознаграждения» были просто оттенками цвета, а не очками. В каждом пробном испытании добровольцы выбирали между двумя абстрактными фигурами, каждая из которых была связана с мешком, дающим в основном синеватые или в основном оранжеватые результаты. Важно, что наблюдение цвета не давало и не отнимало деньги немедленно; оно лишь раскрывалo статистический паттерн, стоящий за этой опцией, как узнавание того, как обычно ведёт себя игровой автомат. 
Три способа задать один и тот же вопрос
Хитрый поворот состоял в том, чтобы сохранить опыт выборок одинаковым, изменив только инструкции и момент появления вознаграждений. В условии MATCH людям говорили собирать целевой цвет, и каждый результат ближе к целевому немедленно приносил очки, имитируя классические дилеммы «исследовать–эксплуатировать». В условии GUESS в процессе выборок не было цели; только в конце последовательности участникам задавали вопрос, какая опция в основном синяя или в основном оранжевая, и платили только за этот финальный ответ. Условие FIND занимало промежуточное положение: целевой цвет был известен с самого начала, но вознаграждения по-прежнему зависели только от единственного итогового выбора. В нескольких независимых группах команда показала, что показатели во всех условиях значительно выше случайных, что подтверждает: участники выучили соответствия цвет–опция.
Сгруппирование против погоня за неопределённостью
Когда исследование не конкурировало с немедленным вознаграждением, поведение людей оказалось удивительно структурированным. В условии GUESS они начинали каждую новую последовательность с того, что многократно выбирали одну и ту же опцию подряд, как будто желая получить прочное первое впечатление об этой самой опции. Только после этой «групповой» серии повторных выборов они переключались и, позже в последовательности, начинали отдавать предпочтение той опции, которая в данный момент была более неопределённой. Авторы называют первую тенденцию локальным минимизированием неопределённости: уменьшать сомнения относительно опции, с которой вы в данный момент взаимодействуете. Позже проявляющаяся тенденция — глобальное минимизирование неопределённости: целенаправленно выбирать опцию, о поведении которой вы знаете меньше всего. В противовес этому, в условии MATCH, где каждый результат имел явную ценность, люди быстро тяготели к опции, лучше соответствующей целевому цвету, и гораздо меньше демонстрировали начальный паттерн группирования. 
Заглядывая под капот с помощью вычислительных моделей
Чтобы глубже понять эти паттерны, исследователи построили математические модели, предсказывающие выборы на основе истории наблюдаемых цветов. «Оптимальный» сэмплер, не учитывающий умственные затраты, всегда бы выбирал наиболее неопределённую опцию, чтобы максимально эффективно получать информацию. Человеческие участники не вели себя как этот идеальный агент. Подбор моделей показал, что помимо умеренной склонности гнаться за неопределённостью при отложенных вознаграждениях, у людей была сильная предрасположенность повторять предыдущий выбор и, во многих случаях, продолжать повторять, пока они не достигали личного порога уверенности в этой опции. Интересно, что индивиды, у которых сильнее проявлялось раннее сгруппирование, часто также демонстрировали более целенаправленное исследование позже и в целом показывали лучшие результаты, что указывает на то, что эта на первый взгляд субоптимальная стратегия может быть полезным компромиссом с учётом когнитивных ограничений человека.
Почему это важно для повседневного любопытства
Эти результаты показывают, что когда мы исследуем, не беспокоясь о немедленных выплатах, наше любопытство формируется двумя силами. Одна побуждает оставаться с тем, что мы в данный момент изучаем, чтобы убедиться, что мы действительно это понимаем; другая подталкивает к тому, о чём мы знаем меньше всего в целом. В реальной жизни просмотр отзывов, изучение нового города или испытание новых инструментов, вероятно, отражает тот же баланс между локальным и глобальным поиском информации. Исследование демонстрирует, что если изучать исследование только в задачах с большими вознаграждениями, мы рискуем неверно понять, как люди естественно стремятся к знаниям ради них самих.
Цитирование: Alméras, C., Chambon, V. & Wyart, V. Competing cognitive pressures on human exploration in the absence of trade-off with exploitation. Nat Commun 17, 883 (2026). https://doi.org/10.1038/s41467-026-68639-2
Ключевые слова: человеческое исследование, принятие решений, неопределённость, поиск информации, когнитивное моделирование