Clear Sky Science · ru
Общие эффекты собственных и чужих переживаний во время обучения с подкреплением на эпизодическую память
Почему важно и смотреть, и действовать для запоминания
Каждый день мы учимся на собственных решениях — например, пробуя новый путь на работу — и на том, что происходит с другими — например, наблюдая, как у друга забирают права за превышение скорости. В этом исследовании задают, казалось бы, простой вопрос: влияет ли на формирование живых воспоминаний то, действовали ли мы сами или лишь наблюдали за другим? И связывают ли мозговые внутренние сигналы «удива» при получении награды делание, наблюдение и запоминание одним и тем же образом?

Риск в игре выигрышей и потерь
Исследователи пригласили молодых взрослых сыграть в компьютерную игру, где чередовались два типа испытаний. В одних участники решали, «рисковать» ради очков или сыграть безопасно; в других они просто наблюдали, как якобы другой игрок (на самом деле модель на компьютере) делает тот же выбор. На каждом испытании показывали потенциальный размер награды, затем уникальную картинку объекта или животного, которая намекала на вероятность выигрыша. Позже, без предупреждения, участники проходили тест памяти: им показывали все старые картинки вместе с похожими новыми, и нужно было сказать, старая ли каждая картинка или новая, а также с какой уверенностью они это делают.
Делать самому запоминается сильнее
При сравнении способности людей отличать старые картинки от новых результаты были явно выше уровня случайности и в обучении через действие, и в обучении через наблюдение. Иными словами, факт участия в задаче — будь то действие или наблюдение — был достаточен для формирования достаточно точных воспоминаний. Однако была и тонкость: участники чувствовали большую уверенность в своих воспоминаниях о картинках из испытаний, где они сами принимали решение. Даже при сопоставимой объективной точности воспоминания, связанные с собственными выборами, казались более сильными и яркими, чем те, которые сформировались во время наблюдения за другим.

Рискованные решения и сюрпризы вознаграждения усиливают память
Другой аспект исследования касался того, как риск и вознаграждение влияют на запоминание. И при действии, и при наблюдении картинки, показанные в испытаниях, где выбирали ставку, запоминались лучше, чем картинки из безопасных «пропусков». Авторы также рассмотрели так называемые ошибки предсказания вознаграждения — внутренние сигналы, отражающие разрыв между ожидаемой и фактической выгодой. Когда картинка указывала на более благоприятную, чем ожидалось, вероятность вознаграждения и ставка была сделана, последующая память об этой картинке усиливалась — как если выбор делал сам участник, так и если его делал наблюдаемый игрок. Примечательно, что очень маленькие или очень большие потенциальные награды обычно ослабляли память, вероятно потому, что люди могли решить играть или пасовать, опираясь только на число, и уделяли меньше внимания картинке.
Наблюдение за другими может задействовать тот же механизм обучения
Подгоняя вычислительные модели обучения к выбору участников, исследователи показали, что люди обновляли свои представления о вероятностях вознаграждения схожим образом и при действии, и при наблюдении. Сигналы, связанные с удивлением и неопределенностью, помогали регулировать скорость, с которой они учились на новых исходах. Что важно, благотворная связь между положительными сюрпризами вознаграждения во время показа картинки и последующей памятью проявлялась в обоих режимах обучения. Игра также вызывала у многих добровольцев чувства соревновательности — им было приятнее, когда другой игрок проигрывал, чем когда выигрывал — и эта конкурентность была связана с несколько более сильными воспоминаниями в условиях собственных игр, что указывает на то, что мотивация и социальное сравнение могут избирательно усиливать память о наших собственных переживаниях.
Что это значит для повседневного обучения
Для неспециалиста главный вывод таков: наша система памяти использует схожие внутренние сигналы «удивления», когда мы учимся на собственных действиях и когда учимся, наблюдая за другими, особенно в ситуациях, связанных с риском и вознаграждением. Наблюдательное обучение может закладывать устойчивые воспоминания, но собственные действия чаще делают эти воспоминания более уверенными и принадлежащими лично нам. В классных комнатах, на рабочих местах и в социальных ситуациях это означает, что сочетание активного принятия решений с возможностью наблюдать за другими — и обеспечение появления важной информации именно тогда, когда исходы неопределенны и потенциально лучше, чем ожидалось — может быть сильной формулой для того, чтобы опыт действительно запомнился.
Цитирование: Woitow, M.A., Jang, A.I., Eppinger, B. et al. Shared effects of one’s own and others’ experiences during reinforcement learning on episodic memory. npj Sci. Learn. 11, 16 (2026). https://doi.org/10.1038/s41539-026-00409-7
Ключевые слова: наблюдательное обучение, ошибка прогноза вознаграждения, эпизодическая память, рискованное поведение, принятие решений