Clear Sky Science · pt

Generalização cognitiva semelhante à humana em grandes modelos via supervisão guiada por representação mental

2026-04-01 · Voltar ao índice

Por que ensinar a IA a pensar como nós importa

A inteligência artificial moderna consegue reconhecer rostos, rotular fotos e escrever textos fluentes, mas ainda tem dificuldade com o tipo de compreensão flexível que as pessoas usam no dia a dia. Podemos ver um exemplo ao observar um pássaro e então reconhecer muitos tipos de pássaros, ou perceber que uma rede e um carrinho de bebê envolvem ambos deitar-se para descansar. Este artigo explora uma nova forma de ajudar modelos computacionais a se aproximarem desse tipo de pensamento semelhante ao humano, usando a própria atividade cerebral como sinal de ensino.

Onde as máquinas inteligentes de hoje falham

Sistemas padrão de aprendizado profundo se tornam mais capazes principalmente por ficarem maiores e serem treinados com mais dados. Essa receita funciona bem para tarefas concretas, como reconhecer meias, cisnes ou carros em imagens. Contudo, os autores mostram que simplesmente aumentar o número de parâmetros do modelo traz pouco ganho na apreensão de ideias abstratas, como vestuário, aves ou a divisão mais ampla entre seres vivos e não vivos. Quando os modelos foram testados em tarefas de aprendizagem com um único exemplo (one-shot), eles melhoraram muito em objetos específicos conforme cresciam, mas pouco ou nada — e às vezes até pioraram — em categorias de nível superior. Análises de como os modelos internamente separam conceitos revelaram que, ao contrário do cérebro humano, eles não agrupavam naturalmente seres vivos separados de ferramentas e outros objetos.

Figure 1. Como padrões cerebrais podem ensinar a IA a agrupar e compreender objetos de forma mais parecida com a humana.

Deixando o cérebro guiar a máquina

Para enfrentar essa lacuna, os pesquisadores projetaram o que chamam de supervisão guiada por representação mental. Voluntários ficaram em um scanner cerebral enquanto observavam muitas imagens naturais. A partir desses registros, a equipe extraiu padrões de atividade em áreas do córtex visual conhecidas por codificar informações ricas e de alto nível sobre o que vemos. Ao mesmo tempo, uma rede artificial processou as mesmas imagens. A ideia central foi forçar a estrutura interna de similaridades e diferenças entre objetos no modelo a se alinhar com a estrutura encontrada no cérebro. Os autores trataram tanto o cérebro quanto o modelo como grafos de conceitos interconectados e usaram um procedimento iterativo de pareamento de grafos para aproximá-los.

Como se comportam os modelos alinhados ao cérebro

Após esse treinamento especial, os modelos não passaram a memorizar apenas as imagens supervisionadas. Em vez disso, desenvolveram um mapa de conceitos mais parecido com o humano que generalizou para muitos objetos novos nunca pareados com dados cerebrais. Os modelos aprimorados ficaram muito melhores em aprendizagem one-shot para categorias abstratas, mostrando aglomerados mais nítidos para conceitos como animal, veículo ou instrumento musical. Suas hierarquias internas passaram a lembrar o WordNet, um banco de dados construído manualmente sobre como palavras em inglês se relacionam, embora os modelos nunca tenham sido explicitamente treinados nessa estrutura. Ao serem solicitados a escolher o “intruso” entre três imagens, os modelos guiados pelo cérebro escolheram de maneiras que se aproximaram mais de amplos conjuntos de julgamentos humanos. Eles também se mostraram mais difíceis de enganar com pequenas distorções cuidadosamente elaboradas nas imagens, sugerindo uma compreensão mais profunda e robusta do que são os objetos.

Uma janela para um espaço de conceitos mais humano

Os autores foram além e examinaram a “variedade conceitual”, ou mapa de baixa dimensionalidade, subjacente aos modelos guiados pelo cérebro. Ao navegar por esse mapa e decodificar pontos em descrições em linguagem natural, mostraram que posições próximas correspondiam a ideias semanticamente relacionadas, como diferentes tipos de vestuário ou veículos. Interpolar entre regiões produzia transições suaves, como deslizar de dispositivos eletrônicos em direção a animais e chegar a cavalos ao cruzar entre veículos e mamíferos ungulados. O sistema também podia resumir várias imagens relacionadas em uma única frase significativa e executar simples “aritméticas de conceito”, ajustando legendas ao adicionar ou subtrair elementos como cavalo ou motocicleta de maneira coerente com a intuição humana.

Figure 2. Como alinhar a IA com a atividade cerebral reformula seus mecanismos internos para lidar melhor com categorias abstratas e novas situações.

O que isso significa para a IA futura

Em termos práticos, este trabalho sugere que dar às IAs um empurrão a partir do cérebro humano pode ajudá-las a ir além do reconhecimento de padrões rumo a algo mais próximo da nossa própria forma de organizar conhecimento. Em vez de apenas aumentar o tamanho dos modelos, o estudo mostra que moldar seu espaço de conceitos interno para espelhar a estrutura cerebral pode melhorar sua capacidade de lidar com situações novas, abstratas e incomuns. Embora a abordagem ainda dependa de exames cerebrais detalhados de indivíduos, expandir esse treinamento informado pelo cérebro pode levar a sistemas artificiais mais adaptáveis, interpretáveis e alinhados com a forma como humanos percebem e raciocinam sobre o mundo.

Citação: Chen, J., Qi, Y., Wang, Y. et al. Human-like cognitive generalization for large models via mental representation-guided supervision. Nat Commun 17, 4709 (2026). https://doi.org/10.1038/s41467-026-71267-5

Palavras-chave: aprendizado guiado pelo cérebro, conceitos abstratos, redes neurais profundas, hierarquia de conceitos, generalização cognitiva