Clear Sky Science · pt

Reforço impulsiona a adaptação motora durante, não entre, tentativas

· Voltar ao índice

Como prática e recompensa moldam nossos movimentos

Ações cotidianas como alcançar uma caneca de café ou arremessar uma bola parecem sem esforço, mas nossos cérebros estão constantemente refinando esses movimentos. Este estudo faz uma pergunta enganadoramente simples: quando praticamos, recompensas e punições nos ajudam a melhorar enquanto estamos no meio do movimento, ou apenas de uma tentativa para a seguinte? A resposta revela como motivação e as diferenças naturais entre tentativas se combinam para moldar a aprendizagem de novas habilidades motoras.

Duas maneiras de o cérebro aprender com erros de movimento

Quando nos movemos em uma situação nova ou alterada, o cérebro pode aprender de pelo menos duas formas. Uma rota atualiza o plano entre tentativas: ao ver onde o último alcance falhou, ajustamos sutilmente onde mirar na próxima vez. A outra rota ajusta durante o próprio movimento: à medida que o feedback visual mostra a mão saindo da trajetória, os sistemas de controle corrigem a ação em tempo real. Os autores queriam saber se essas duas vias são influenciadas de forma diferente por recompensas e punições, e se a variabilidade natural nos movimentos iniciais das pessoas ajuda ou atrapalha a aprendizagem em cada caso.

Figure 1
Figure 1.

Dois jogos com joystick: com e sem correção em curso

Para separar esses processos, voluntários jogaram duas tarefas de computador baseadas em joystick enquanto a relação entre o movimento da mão e o cursor era secretamente rotacionada. Na tarefa “Reaching” (Alcançar), o cursor seguia fielmente o joystick, permitindo que os participantes curvassem a trajetória no meio do movimento para dirigir ao alvo. Essa configuração permite que tanto o planejamento entre tentativas quanto a correção dentro da tentativa contribuam para a melhora. Na tarefa “Curling”, por outro lado, apenas o começo do movimento do joystick importava: uma vez que o cursor avançava uma curta distância, ele deslizava em linha reta e não podia mais ser influenciado, muito parecido com uma pedra de curling no gelo. Aqui, o desempenho poderia melhorar apenas ajustando o plano inicial de uma tentativa para a outra, não corrigindo erros durante o trajeto.

Motivação fortalece correção durante o movimento, não só o planejamento

Em ambos os jogos, as pessoas compensaram gradualmente a rotação visual, mostrando sinais claros de adaptação motora, economia ao revisitar a perturbação e retenção após uma pausa de meia hora. No entanto, permitir correções em curso fez uma grande diferença: no jogo Reaching, os erros reduziram mais e as taxas de aprendizado foram maiores do que no jogo Curling, embora o curso temporal geral da adaptação fosse semelhante. Crucialmente, recompensas e punições ligadas ao desempenho melhoraram os resultados apenas na tarefa Reaching. Quer os participantes ganhassem mais dinheiro por movimentos precisos ou perdessem por erros grandes, seu desempenho superou o do grupo com feedback neutro — mas somente quando podiam guiar o cursor continuamente. Quando o sucesso dependia puramente de planejar uma boa investida inicial, o reforço não teve impacto detectável.

Variação útil no planejamento, atenuada durante a correção

Os pesquisadores também examinaram quanto os movimentos iniciais das pessoas variavam em direção quando a rotação foi introduzida pela primeira vez. Na tarefa Curling, participantes que apresentaram maior variabilidade inicial acabaram aprendendo mais, mesmo após controlar por melhorias iniciais rápidas. Isso sugere que, quando correções são impossíveis, experimentar planos ligeiramente diferentes — o que os autores chamam de “ruído de planejamento” — ajuda o cérebro a explorar e refinar melhores estratégias entre tentativas. Na tarefa Reaching, por contraste, a variabilidade inicial refletiu em grande parte a rápida redução de erro nas primeiras tentativas e não previu quanto as pessoas acabariam se adaptando. Como o feedback visual contínuo permite que o sistema corrija erros em tempo real, o valor informacional dessas diferenças iniciais parece ser atenuado.

Figure 2
Figure 2.

Por que isso importa para treinamento e reabilitação

Em conjunto, esses resultados mostram que o reforço fortalece principalmente a habilidade do cérebro de corrigir movimentos à medida que eles se desenrolam, enquanto a variabilidade natural de como iniciamos nossos movimentos apoia principalmente a aprendizagem que ocorre de uma tentativa para a próxima. Para treinamento cotidiano, instrução esportiva e reabilitação, isso significa que recompensas ou penalidades podem ser mais eficazes quando as tarefas permitem feedback contínuo e ajuste, ao passo que aproveitar cuidadosamente a variação nas tentativas iniciais pode ser especialmente valioso quando apenas o impulso inicial determina o sucesso. Ao separar essas duas vias de aprendizagem, o estudo ajuda a explicar por que pesquisas anteriores relataram efeitos mistos de recompensa e punição na aprendizagem motora, e aponta para maneiras mais direcionadas de desenhar práticas que trabalhem com — em vez de contra — os mecanismos de aprendizagem embutidos do nosso sistema nervoso.

Citação: Lehnberg, F.M., Paul, T., Wiemer, V.M. et al. Reinforcement drives within- not between-trial motor adaptation. Sci Rep 16, 11605 (2026). https://doi.org/10.1038/s41598-026-45293-8

Palavras-chave: aprendizado motor, reforço, variabilidade de movimento, adaptação visuomotora, controle motor