Clear Sky Science · pt

Geometria de populações neurais e codificação ótima de tarefas com estrutura latente compartilhada

2026-02-04 · Voltar ao índice

Como o Cérebro Encontra Regras Ocultas em um Mundo Barulhento

Todo dia, nós identificamos padrões com facilidade: luz vermelha significa parar, rua cheia significa desacelerar, determinada postura indica que um animal está prestes a pular. Por trás dessas habilidades está a capacidade do cérebro de descobrir estruturas ocultas, ou “latentes”, no mundo e reutilizá-las em várias tarefas diferentes. Este artigo faz uma pergunta aparentemente simples: o que torna um padrão de atividade populacional neural melhor do que outro para resolver rapidamente e com precisão muitas tarefas relacionadas?

Os Botões Ocultos por Trás dos Códigos Neurais
Figure 1.

Os autores estudam a atividade cerebral em nível de população, tratando os disparos de muitos neurônios como pontos em um espaço de alta dimensão. Eles focalizam tarefas que compartilham um conjunto subjacente de variáveis latentes — por exemplo, a forma, o tamanho e a posição de um objeto, ou a localização e a velocidade de um animal. Um neurônio ou circuito downstream lê esses padrões com uma regra linear simples, semelhante a traçar um plano através da nuvem de pontos para separar “categoria A” de “categoria B”. Em vez de simular cada neurônio em detalhe, os autores derivam uma fórmula analítica que prevê quão bem tal leitura generalizará para novos exemplos, dada a geometria da atividade neural. De modo notável, eles descobrem que o desempenho é governado por apenas quatro estatísticas que capturam o quanto os neurônios representam as variáveis latentes, quão claramente diferentes variáveis estão separadas, como o ruído está organizado e em quantas dimensões efetivas a atividade ocupa.

Quatro Ingredientes Simples para Boa Generalização

O primeiro ingrediente é a correlação geral entre neurônios individuais e as variáveis latentes: quando pequenas mudanças nas variáveis ocultas provocam deslocamentos claros nas respostas neurais, as leituras downstream têm mais sinal com que trabalhar. O segundo e o terceiro ingredientes descrevem a “fatorização”: idealmente, diferentes variáveis latentes são codificadas em direções independentes, e o ruído aleatório se desloca em direções ortogonais a esses eixos de sinal. Isso facilita que um único limite linear se transfira entre muitas tarefas que dependem da mesma estrutura oculta. O quarto ingrediente é a dimensionalidade efetiva, que captura quantas direções no espaço de atividade a população realmente usa. Dimensionalidade maior tende a diluir o ruído em mais direções, melhorando a confiabilidade, mas deve ser balanceada com a clareza com que o sinal se alinha às variáveis relevantes para o comportamento.

Testando a Teoria em Cérebros Artificiais e Biológicos
Figure 2.

Para verificar a teoria, os autores primeiro a aplicam a redes neurais artificiais. Em perceptrons multicamadas treinados em muitos problemas de classificação relacionados, e em uma rede profunda treinada para rastrear partes do corpo de camundongos em vídeo, eles medem as quatro quantidades geométricas em cada camada. Os erros previstos coincidem de perto com o desempenho real de leituras simples treinadas nessas representações internas. Em seguida, voltam-se para dados de cérebros reais. Gravações de áreas visuais de macacos mostram que, à medida que os sinais seguem dos olhos para o córtex visual superior, a geometria evolui de modo a reduzir o erro de generalização: as correlações com variáveis latentes aumentam, a variabilidade incômoda é deslocada para longe das direções de sinal e certas formas de dimensionalidade são remodeladas. Em ratos aprendendo uma tarefa de alternância espacial, tanto o comportamento quanto o desempenho das leituras melhoram ao longo de dias de treino, enquanto a geometria da atividade no hipocampo e no córtex pré-frontal muda de maneiras sistemáticas que espelham as previsões da teoria.

Como o Aprendizado Reescreve o Espaço Neural

Porque sua fórmula liga a geometria diretamente ao desempenho, os autores podem perguntar como um código neural “ótimo” deve se parecer em diferentes estágios do aprendizado. No início, quando há apenas alguns exemplos de treino disponíveis, os melhores códigos são de baixa dimensionalidade e fortemente alinhados com as variáveis latentes mais informativas, efetivamente comprimindo características menos úteis. Conforme a experiência se acumula, a solução ótima muda: a representação da estrutura relevante para a tarefa expande-se para mais dimensões, e a forte correlação entre neurônios individuais e variáveis isoladas na verdade relaxa. Em outras palavras, o cérebro parece começar com um esboço focado e de baixa dimensão da tarefa e gradualmente preenche um mapa mais rico e distribuído à medida que aprende.

Por Que Isso Importa para Entender Cérebros e Máquinas

Para um leitor leigo, a mensagem-chave é que a atividade populacional do cérebro não é apenas um emaranhado de picos; ela tem uma forma, e essa forma importa. Ao identificar quatro características geométricas mensuráveis que controlam quão bem leituras simples podem generalizar entre tarefas relacionadas, este trabalho oferece uma linguagem comum para comparar redes neurais biológicas e artificiais. Sugere que, à medida que animais e máquinas aprendem, eles reorganizam sua atividade interna de códigos compactos e altamente alinhados para códigos de maior dimensão e melhor fatorizados que ainda protegem a informação relevante para a tarefa contra o ruído. Essa visão geométrica ajuda a explicar como os mesmos circuitos cerebrais podem reutilizar flexivelmente estruturas ocultas em muitas situações, sustentando a generalização aparentemente sem esforço que fundamenta a inteligência cotidiana.

Citação: Wakhloo, A.J., Slatton, W. & Chung, S. Neural population geometry and optimal coding of tasks with shared latent structure. Nat Neurosci 29, 682–692 (2026). https://doi.org/10.1038/s41593-025-02183-y

Palavras-chave: geometria de população neural, codificação de variáveis latentes, aprendizado multitarefa, representações disentangladas, generalização em redes neurais