Clear Sky Science · pt

Efeitos compartilhados das próprias experiências e das dos outros durante o aprendizado por reforço na memória episódica

· Voltar ao índice

Por que tanto observar quanto agir importam para a memória

A vida cotidiana está cheia de aprendizado a partir de nossas próprias escolhas — como testar um novo caminho para o trabalho — e de observar o que acontece com os outros — como ver um amigo levar uma multa por excesso de velocidade. Este estudo faz uma pergunta aparentemente simples: ao formar memórias vívidas, importa realmente se agimos nós mesmos ou apenas observamos outra pessoa? E os sinais internos de “surpresa” do cérebro durante recompensas conectam agir, observar e lembrar da mesma forma?

Figure 1
Figure 1.

Assumindo riscos em um jogo de ganhos e perdas

Os pesquisadores convidaram adultos jovens a jogar um jogo de computador que misturava dois tipos de ensaio. Em alguns, os participantes decidiam se “arriscar” por pontos ou jogar seguro; em outros, eles simplesmente observavam um suposto outro jogador (na verdade um modelo computacional) fazer a mesma escolha. Cada ensaio mostrava um tamanho possível de recompensa seguido por uma imagem única de um objeto ou animal que indicava a chance de vitória. Mais tarde, sem aviso, os participantes fizeram um teste de memória: viram todas as imagens antigas mais outras semelhantes e precisavam dizer se cada uma era antiga ou nova, e quão confiantes se sentiam.

Fazer por conta própria parece mais memorável

Quando a equipe comparou quão bem as pessoas distinguiam imagens antigas de novas, o desempenho ficou claramente acima do acaso tanto no aprendizado por agir quanto no por observar. Em outras palavras, simplesmente participar da tarefa — seja agindo ou observando — foi suficiente para formar memórias razoavelmente precisas. No entanto, havia uma reviravolta: os participantes se sentiram mais confiantes em suas memórias para imagens de ensaios em que eles mesmos tinham sido os tomadores de decisão. Mesmo quando a acurácia objetiva era semelhante, as memórias ligadas às próprias escolhas pareciam mais fortes e mais vívidas do que aquelas formadas ao assistir outra pessoa jogar.

Figure 2
Figure 2.

Escolhas arriscadas e surpresas de recompensa aumentam a memória

Outra camada do estudo concentrou-se em como risco e recompensa moldaram o lembrar. Tanto ao agir quanto ao observar, as imagens exibidas em ensaios em que o jogador arriscou foram lembradas melhor do que aquelas de ensaios “passar” seguros. Os autores também examinaram os chamados erros de previsão de recompensa — sinais internos que acompanham a diferença entre o que esperamos ganhar e o que realmente podemos obter. Quando uma imagem indicava uma chance de recompensa melhor do que a esperada e o risco foi assumido, a memória posterior para essa imagem foi aprimorada, quer a escolha tivesse sido feita pelo participante ou pelo jogador observado. De forma marcante, recompensas potenciais muito pequenas ou muito grandes tendiam a enfraquecer a memória, provavelmente porque as pessoas podiam decidir jogar ou passar com base apenas no número e prestavam menos atenção à imagem.

Observar os outros pode acionar o mesmo motor de aprendizado

Ao ajustar modelos computacionais de aprendizado às escolhas, os pesquisadores mostraram que os participantes atualizaram suas crenças sobre as probabilidades de recompensa de maneira semelhante ao agir e ao observar. Sinais impulsionados por surpresa e incerteza ajudaram a ajustar a velocidade com que aprendiam a partir de novos resultados. Importante, a ligação benéfica entre surpresas positivas de recompensa durante a visualização da imagem e a memória posterior apareceu em ambos os modos de aprendizado. O jogo também despertou sentimentos competitivos em muitos voluntários — eles ficaram mais felizes quando o outro jogador perdia do que quando esse jogador ganhava — e essa competitividade esteve ligada a memórias um pouco mais fortes na condição em que jogavam, sugerindo que motivação e comparação social podem aguçar seletivamente as lembranças de nossas próprias experiências.

O que isso significa para o aprendizado do dia a dia

Para o público geral, a mensagem principal é que nosso sistema de memória usa sinais internos de “surpresa” semelhantes quando aprendemos com nossas próprias ações e quando aprendemos observando os outros, especialmente em situações envolvendo risco e recompensa. O aprendizado por observação pode plantar memórias sólidas, mas agir por conta própria tende a fazer com que essas memórias pareçam mais certas e pessoalmente pertencentes. Em salas de aula, locais de trabalho e ambientes sociais, isso implica que combinar tomada ativa de decisão com oportunidades de observar outros — e garantir que informações importantes apareçam justamente quando os resultados são incertos e potencialmente melhores do que o esperado — pode ser uma receita poderosa para experiências que realmente permanecem na memória.

Citação: Woitow, M.A., Jang, A.I., Eppinger, B. et al. Shared effects of one’s own and others’ experiences during reinforcement learning on episodic memory. npj Sci. Learn. 11, 16 (2026). https://doi.org/10.1038/s41539-026-00409-7

Palavras-chave: aprendizado por observação, erro de previsão de recompensa, memória episódica, assumir riscos, tomada de decisão