Clear Sky Science · pt

Uma rede neural para modelar a formação, compreensão e comunicação de conceitos humanos

· Voltar ao índice

Como mentes transformam imagens em ideias

Quando você ouve a palavra “jantar”, pode imaginar uma mesa, cheiros e sons, mesmo sem ver comida alguma. Essa habilidade de converter cenas sensoriais ricas em ideias compactas e depois recuperá‑las mais tarde sustenta a linguagem, o planejamento e o entendimento compartilhado. O artigo apresenta um novo tipo de rede neural artificial que busca capturar essa mágica cotidiana da mente humana, oferecendo pistas sobre como cérebros podem organizar conhecimento e como máquinas futuras poderiam pensar de maneira mais parecida com a humana.

Figure 1. Como códigos de conceito comprimidos transformam experiências visuais variadas em decisões flexíveis e entendimento compartilhado entre sistemas.
Figure 1. Como códigos de conceito comprimidos transformam experiências visuais variadas em decisões flexíveis e entendimento compartilhado entre sistemas.

Compactando experiências ricas em códigos simples

Os autores partem de uma pergunta simples: como o cérebro comprime entradas sensoriais detalhadas em um conjunto menor de conceitos e então usa esses conceitos de forma flexível? Redes artificiais atuais são muito boas em reconhecer imagens, mas escondem o que aprendem em milhões de parâmetros, dificultando a reutilização de conhecimento ou seu compartilhamento com outros sistemas. Grandes modelos de linguagem, por sua vez, dependem de palavras humanas já existentes, em vez de construir conceitos diretamente a partir de imagens e sons. A nova estrutura, chamada CATS Net, foi projetada para modelar tanto a formação de conceitos quanto seu uso dentro de um único sistema, partindo apenas de tarefas visuais.

Dois módulos cooperativos para conceitos e decisões

A CATS Net divide o pensamento em duas partes interagentes. Um módulo de abstração de conceitos aprende um código numérico curto, ou “vetor de conceito”, para cada tipo de objeto, como maçãs ou ônibus, com base em exemplos visuais. Um módulo separado de resolução de tarefas recebe características de imagem de uma espinha dorsal visual padrão e deve responder a perguntas simples de sim ou não, como “Isto é uma maçã?” O truque principal é um processo de gating: o vetor de conceito controla como a atividade flui pelas camadas do solucionador de tarefas, remodelando a mesma rede para lidar com diferentes conceitos sem alterar sua fiação central. O treinamento alterna entre ajustar os módulos e ajustar os vetores de conceito, de modo que tanto a rede quanto seus conceitos internos se especializam gradualmente.

Descobrindo um mapa de significado parecido com o humano

Uma vez treinada em grandes conjuntos de imagens, a CATS Net não só classifica imagens inéditas com alta precisão como também desenvolve um “espaço de conceitos” organizado. Códigos próximos tendem a representar coisas relacionadas, como animais se agrupando ou ferramentas formando seu próprio conjunto. Os autores mostram que essa disposição não é arbitrária: ela corresponde a padrões encontrados em estudos humanos nos quais pessoas avaliam quão semelhantes os objetos parecem, e em modelos baseados em linguagem que descrevem significado ao longo de várias dimensões, como comida, mobiliário ou valor emocional. Notavelmente, quando os pesquisadores comparam os padrões de similaridade internos da rede com imagens cerebrais obtidas enquanto voluntários nomeavam objetos, encontram que a camada de conceito se alinha com atividade em uma região visual de alto nível e que o módulo de gating se assemelha a áreas envolvidas no controle do acesso ao significado.

Compartilhando conhecimento apenas por conceitos

O estudo também investiga se conceitos de baixa dimensionalidade podem servir como moeda comum entre diferentes redes. A equipe treina versões separadas “professor” e “aluno” da CATS Net em conjuntos de categorias que se sobrepõem e, em seguida, adiciona um pequeno módulo de tradução que mapeia vetores de conceito do espaço do professor para o espaço do aluno. Sem alterar os pesos principais da rede, o aluno pode usar um vetor de conceito traduzido para uma categoria que nunca viu durante o treinamento e ainda assim performar bem acima do acaso em julgamentos de sim ou não. Em outros testes, a CATS Net usa com sucesso espaços de conceito derivados de humanos, construídos a partir de estatísticas de linguagem e dados comportamentais, tratando‑os como se fossem seus próprios códigos internos.

Figure 2. Como um vetor de conceito controla as camadas de uma rede neural para que a mesma arquitetura resolva diferentes tarefas binárias baseadas em imagens.
Figure 2. Como um vetor de conceito controla as camadas de uma rede neural para que a mesma arquitetura resolva diferentes tarefas binárias baseadas em imagens.

Por que isso importa para mentes e máquinas

Em conjunto, esses resultados sugerem que códigos de conceito compactos, combinados com gating flexível do processamento sensorial, podem oferecer uma receita viável para um pensamento conceitual semelhante ao humano. O modelo demonstra como experiências visuais ricas podem ser comprimidas em representações reutilizáveis e compartilháveis que se alinham com padrões tanto do comportamento humano quanto da atividade cerebral. Embora o trabalho foque em objetos concretos que podemos ver e nomear, ele aponta para sistemas futuros que também poderiam capturar ideias mais abstratas, aproximando a inteligência artificial da forma como as pessoas formam, entendem e comunicam conceitos.

Citação: Guo, L., Chen, H., Chen, Y. et al. A neural network for modeling human concept formation, understanding and communication. Nat Comput Sci 6, 497–511 (2026). https://doi.org/10.1038/s43588-026-00956-4

Palavras-chave: formação de conceitos, redes neurais, cognição semântica, alinhamento com o cérebro, comunicação de conceitos