Clear Sky Science · pt

Mecanismos neurais e computacionais por trás da aprendizagem perceptual de uma única vez em humanos

· Voltar ao índice

Vendo a Imagem Oculta

Muita gente já viveu aquele momento repentino de “aha!” quando uma imagem confusa em preto e branco de manchas se transforma de repente em uma imagem clara de um cachorro ou de um rosto — e, uma vez que você a vê, não consegue deixar de vê-la. Este estudo investiga como um único vislumbre breve de uma imagem nítida pode mudar permanentemente o que percebemos em uma versão embaçada, e o que isso revela sobre como nossos cérebros — e futuros sistemas de inteligência artificial — aprendem a partir de apenas um exemplo.

Figure 1
Figure 1.

De Manchas Borradas ao Reconhecimento Instantâneo

Os pesquisadores usaram as clássicas “imagens de Mooney”: figuras extremamente simplificadas em preto e branco que são difíceis de reconhecer até que se veja a foto em tons de cinza da qual elas derivaram. Voluntários primeiro tentaram nomear o que viam nessas imagens difíceis. Depois, visualizaram brevemente as fotos claras correspondentes e então tentaram novamente as imagens difíceis. Após essa única exposição, as pessoas passaram a reconhecer subitamente as imagens antes misteriosas, e essa melhora persistiu. Ao alterar cuidadosamente as fotos claras — invertendo-as horizontalmente, rotacionando-as, mudando seu tamanho ou deslocando sua posição na tela — a equipe mapeou que tipo de informação visual o cérebro realmente armazena durante essa aprendizagem de uma única vez.

Onde o Cérebro Armazena a Nova Intuição

Diferentes alterações nas imagens afetaram a aprendizagem de maneiras distintas. Tornar a imagem clara duas vezes maior ou metade do tamanho não prejudicou a aprendizagem, sugerindo que o “template” armazenado pelo cérebro é flexível em relação ao tamanho. Mas inverter, rotacionar ou deslocar a imagem na tela enfraqueceu a aprendizagem, embora não a tornasse impossível. Substituir a imagem clara por um exemplo diferente da mesma categoria — por exemplo, outro cachorro — aboliu completamente a aprendizagem. Isso mostra que o cérebro não está apenas armazenando a ideia “isto é um cachorro”; em vez disso, mantém uma memória detalhada, semelhante a uma imagem, da forma e do arranjo específicos daquela imagem exata. Ao combinar esses resultados comportamentais com o que se conhece sobre o sistema visual, os autores apontaram para áreas visuais de alto nível, mais do que para regiões visuais iniciais ou estruturas de memória como o hipocampo, como o local provável de armazenamento desse novo conhecimento.

Observando a Aprendizagem Desdobrar-se Dentro do Cérebro

Para confirmar isso, a equipe usou ressonância magnética ultrarrésolutiva de 7 Tesla e registros diretos de eletrodos colocados nos cérebros de pacientes com epilepsia. Os experimentos de RM mostraram que neurônios em uma região chamada córtex visual de alto nível responderam a diferentes versões do mesmo objeto (alteradas em tamanho, posição ou orientação) exatamente da forma prevista pelos testes comportamentais. Nos registros por eletrodos, a alteração crucial apareceu primeiro nesse córtex visual de alto nível: após a aprendizagem, os padrões de atividade desencadeados pela imagem difícil tornaram-se mais semelhantes aos desencadeados por sua contraparte clara, e isso ocorreu mais cedo ali do que nas áreas visuais primárias. Esse timing sugere que essa região é onde a nova “prior” é armazenada e reativada, e que ela então envia feedback descendente para áreas visuais anteriores para ajudar a interpretar entradas ambíguas.

Figure 2
Figure 2.

Construindo uma Máquina que Aprende em Uma Só Exposição

Os pesquisadores também construíram um modelo de rede neural profunda projetado para imitar essa habilidade. O sistema deles usou um transformer de visão moderno como um motor visual “bottom-up”, emparelhado com um módulo especial que armazena informações prévias e envia feedback “top-down” quando vê posteriormente uma imagem relacionada. Treinado em tarefas do tipo Mooney, o modelo mostrou aprendizagem genuína de uma única vez: sua acurácia saltou após apenas uma exposição à imagem clara e superou em muito o que poderia ser explicado por repetição simples. Ele até compartilhou muitos dos mesmos sucessos e fracassos que observadores humanos tiveram em imagens específicas, e as características internas que aprendeu a partir das imagens claras puderam prever quais figuras as pessoas aprenderiam ou não a reconhecer. Quando a equipe comparou as informações prévias armazenadas pelo modelo com os exames cerebrais humanos, encontrou a correspondência mais próxima nas mesmas regiões visuais de alto nível destacadas pelos experimentos.

Por Que Isso Importa para Cérebros e Máquinas

Em conjunto, esses achados sugerem que nossos repentes momentos de “agora eu vejo!” surgem quando áreas visuais de alto nível ajustam rapidamente suas conexões após uma única experiência, armazenando uma prior detalhada semelhante a uma imagem que mais tarde pode remodelar como interpretamos entradas ruidosas. Essa forma de aprendizagem rápida e, ao mesmo tempo, estável, enraizada no córtex visual de alto nível e sustentada por feedback top-down, oferece um roteiro para construir sistemas de IA que possam aprender a partir de pouquíssimos exemplos. Também fornece um ponto de partida para entender o que pode dar errado quando a percepção se apoia excessivamente em expectativas prévias, como em certas condições psiquiátricas que envolvem alucinações.

Citação: Hachisuka, A., Shor, J.D., Liu, X.C. et al. Neural and computational mechanisms underlying one-shot perceptual learning in humans. Nat Commun 17, 1204 (2026). https://doi.org/10.1038/s41467-026-68711-x

Palavras-chave: aprendizagem one-shot, percepção visual, córtex visual de alto nível, aprendizagem perceptual, redes neurais profundas