Clear Sky Science · pt

Alcançando uma visão mais semelhante ao cérebro humano por meio do alinhamento representacional com EEG humano

· Voltar ao índice

Por que esta pesquisa importa

A inteligência artificial moderna pode reconhecer objetos em fotos com precisão quase humana, mas ainda não “vê” o mundo da mesma forma que nossos cérebros. Este estudo introduz uma nova forma de ajustar sistemas de visão computacional usando sinais cerebrais registrados de voluntários, aproximando a IA de uma compreensão visual mais parecida com a humana. Ao modelar diretamente um sistema de visão com a atividade cerebral humana, o trabalho aponta para um futuro em que a IA não seja apenas poderosa, mas também organizada de maneira mais próxima à de nossas próprias mentes.

Figure 1
Figure 1.

Ensinando máquinas com ondas cerebrais

Os autores se concentram em uma ideia simples, porém ousada: em vez de apenas treinar modelos de visão com imagens e rótulos, por que não também mostrar a eles como o cérebro humano responde a essas imagens? Eles usam eletroencefalografia (EEG), que mede pequenas variações de voltagem no couro cabeludo enquanto as pessoas observam imagens. O EEG é não invasivo, relativamente barato e pode ser coletado rapidamente em muitos ensaios. A partir de dez voluntários, a equipe utilizou um grande conjunto de dados aberto no qual cada pessoa viu dezenas de milhares de imagens de objetos naturais enquanto seus sinais de EEG eram registrados nos primeiros dois décimos de segundo após cada imagem aparecer.

Construindo uma rede de visão alinhada ao cérebro

Partindo de um modelo de visão profunda existente chamado CORnet-S, os pesquisadores adicionaram um módulo extra de “imagem-para-cérebro”. Quando uma imagem entra na rede, o modelo agora realiza duas tarefas ao mesmo tempo: ele tenta adivinhar qual objeto está presente e procurar prever o padrão de EEG que um humano real mostrou para aquela mesma imagem. Para isso, sinais de várias camadas internas da rede são canalizados para o módulo de EEG, que aprende a gerar uma curta série temporal correspondente aos dados humanos. Durante o treinamento, o modelo é recompensado tanto por reconhecer corretamente os objetos quanto por produzir atividade semelhante ao EEG, inclinando suas características internas a se assemelharem às do sistema visual humano.

Mais próximo da atividade cerebral em vários métodos

Após treinar dez desses “ReAlnets” (um por sujeito), a equipe perguntou se esses modelos realmente haviam se tornado mais semelhantes ao cérebro. Eles compararam o padrão de relações entre imagens dentro do modelo com o padrão visto no EEG humano, usando uma técnica chamada análise de similaridade representacional. Em todas as camadas principais e pontos de tempo entre 50 e 200 milissegundos, os ReAlnets foram consistentemente mais semelhantes ao EEG humano do que o CORnet-S original e outros modelos padrão, com ganhos máximos de até cerca de 6% e melhorias relativas de até 40%. Importante, o ganho manteve-se mesmo para novas categorias de objetos nunca usadas durante o treinamento, mostrando que o alinhamento generaliza além do conjunto de treinamento.

Figure 2
Figure 2.

Alcançando varreduras cerebrais e comportamento

Uma questão-chave é se os modelos aprenderam meramente idiossincrasias do EEG ou capturaram algo mais geral sobre a visão humana. Para testar isso, os autores recorreram a um conjunto de dados separado de neuroimagem, onde diferentes voluntários viram imagens naturais, formas abstratas e letras dentro de um scanner de ressonância magnética (MRI). Mesmo que os ReAlnets nunca tivessem visto esses dados, seus padrões internos corresponderam mais de perto aos sinais de várias regiões visuais do cérebro do que o modelo original. Além disso, o grau de melhoria para EEG e para MRI foi fortemente correlacionado entre os modelos, sugerindo que uma representação central compartilhada foi fortalecida. Os pesquisadores também avaliaram com que frequência modelos e humanos cometeram erros semelhantes em tarefas difíceis de reconhecimento de objetos. Aqui também, os ReAlnets alinharam-se melhor ao comportamento humano do que os modelos de referência.

Visão personalizada e geral semelhante ao cérebro

Como cada ReAlnet foi ajustado ao EEG de uma pessoa, os autores puderam investigar diferenças individuais. Eles descobriram que modelos personalizados divergiam mais entre si nas camadas mais profundas, refletindo como as diferenças entre pessoas aumentam das áreas visuais iniciais para as superiores. Ainda assim, o modelo de cada pessoa generalizou para o EEG de outras pessoas melhor do que a linha de base não alinhada, mostrando que capturou tanto estruturas compartilhadas quanto específicas do sujeito. A equipe também estendeu sua abordagem para uma arquitetura diferente, ResNet18, e novamente observou melhor alinhamento com EEG, MRI e (em menor grau) comportamento, sugerindo que o método é flexível e não preso a um único projeto de modelo.

O que isso significa para a compreensão cotidiana

Para um não especialista, a mensagem principal é que agora é possível ajustar algoritmos de visão diretamente usando registros não invasivos do cérebro humano. Os ReAlnets resultantes não apenas reconhecem objetos; eles organizam informações de maneiras que espelham mais de perto nossas próprias vias visuais, através de sinais elétricos cerebrais, varreduras por MRI e até padrões de erro em tarefas de reconhecimento. Embora as melhorias sejam modestas e muitos desafios técnicos permaneçam, este trabalho oferece um passo concreto rumo a sistemas de IA cujos processos internos são moldados pelo próprio cérebro humano, potencialmente levando a tecnologias mais robustas, interpretáveis e personalizadas no futuro.

Citação: Lu, Z., Wang, Y. & Golomb, J.D. Achieving more human brain-like vision via human EEG representational alignment. Commun Biol 9, 463 (2026). https://doi.org/10.1038/s42003-026-09685-w

Palavras-chave: IA alinhada ao cérebro, visão por EEG, reconhecimento de objetos, neurociência computacional, percepção semelhante à humana