Clear Sky Science · pt

Arquitetura de computação-em-memória para redes de Kolmogorov-Arnold baseada em células de memória ajustáveis com forma gaussiana

· Voltar ao índice

Por que essa nova ideia de chip importa

Os sistemas de inteligência artificial atuais, de programas que jogam a jogos a chatbots, dependem de enormes redes de unidades matemáticas simples que consomem muita energia e exigem chips gráficos potentes. Este artigo apresenta um tipo diferente de hardware de IA que mistura memória e computação nos mesmos elementos diminutos e é adaptado a uma nova classe de redes neurais chamadas redes de Kolmogorov–Arnold. O resultado é um conceito de chip que tem como objetivo aprender de forma mais parecida com o cérebro — de modo flexível e eficiente — ao mesmo tempo em que consome muito menos energia do que o hardware dominante hoje.

Figure 1
Figure 1.

Uma maneira nova de as redes neurais aprenderem

A maioria das redes neurais em uso hoje, como perceptrons multicamadas, depende de receitas matemáticas fixas em que o aprendizado ocorre principalmente ajustando a força das conexões entre neurônios artificiais. As redes de Kolmogorov–Arnold adotam uma abordagem diferente: em vez de apenas ajustar forças de conexão, elas aprendem a forma detalhada das funções que transformam entradas em saídas. Essas curvas aprendidas atuam como blocos de construção personalizáveis, permitindo que a rede se adapte a padrões de dados complexos e, de forma importante, retenha tarefas antigas enquanto aprende novas. Contudo, implementar essas funções ricas em chips comuns é caro em termos de circuito e energia, porque exige muitos cálculos repetidos e irregulares que processadores e chips gráficos padrão não executam de maneira eficiente.

Um novo tipo de célula de memória

Para preencher essa lacuna entre algoritmo e hardware, os pesquisadores projetaram um bloco eletrônico básico que chamam de célula de memória com forma semelhante à gaussiana. Cada célula combina dois componentes em nanoescala em série: um transistor especial cuja resposta elétrica sobe e desce em uma curva suave em forma de sino, e um memristor, um dispositivo cuja resistência pode ser permanentemente ajustada por pulsos elétricos. Ao ajustar o memristor, a equipe pode deslocar e escalonar a resposta em forma de sino do transistor, programando efetivamente a altura e a largura de uma curva semelhante à gaussiana diretamente no hardware. Medições mostram que essas células podem ser reprogramadas repetidamente, retêm seu estado por longos períodos e se comportam de maneira uniforme ao longo de muitos ciclos e dispositivos — aspectos vitais para construir grandes matrizes confiáveis.

Transformando células em um cérebro em memória

O passo seguinte é organizar milhares dessas células de memória em circuitos em cruzamento do tipo crossbar. Nessa disposição, linhas e colunas de fios se cruzam em cada célula, e sinais aplicados ao longo das colunas controlam o comportamento das células enquanto correntes coletadas ao longo das linhas somam-se naturalmente segundo leis elétricas básicas. Isso significa que o chip pode executar as operações centrais de uma rede de Kolmogorov–Arnold — somar muitas funções com forma gaussiana para formar uma curva de ativação flexível — diretamente onde a informação está armazenada, sem transferir dados de ida e volta entre processadores e memória separados. Circuitos adicionais permitem que contribuições positivas e negativas sejam representadas e somadas, e caminhos residuais opcionais aumentam a estabilidade de redes profundas sem substituir a computação central em memória.

Testando a arquitetura

Usando simulações detalhadas vinculadas ao comportamento medido dos dispositivos, os autores mostram que redes construídas a partir dessas matrizes de células de memória podem enfrentar uma ampla gama de tarefas. Eles ajustaram com sucesso funções unidimensionais complicadas sem esquecer as anteriores, reconheceram dígitos manuscritos e itens de vestuário, resolveram equações diferenciais parciais e preveram séries temporais caóticas. Nesses cenários, as redes com células gaussianas mantêm as principais forças das redes de Kolmogorov–Arnold: bom desempenho com relativamente poucos parâmetros e uma notável capacidade de evitar o esquecimento catastrófico ao serem treinadas em novas tarefas. Em comparação com redes neurais convencionais implementadas usando hardware memristivo similar, a nova arquitetura frequentemente alcança melhor precisão e generalização usando camadas intermediárias menores.

Figure 2
Figure 2.

Economia de energia e promessa prática

Como a computação ocorre dentro dos mesmos elementos que armazenam os parâmetros aprendidos, a arquitetura proposta evita em grande parte o tráfego custoso entre memória e processador que prejudica o hardware de IA atual. Os autores estimam que seu sistema de células de memória com forma gaussiana pode executar as operações centrais de redes de Kolmogorov–Arnold com cerca de duas ordens de magnitude melhor eficiência energética do que chips gráficos modernos rodando algoritmos equivalentes. Em termos simples, o trabalho descreve como construir chips onde cada minúsculo dispositivo pode tanto lembrar quanto computar respostas flexíveis em forma de sino, e onde muitos desses dispositivos colaboram em paralelo. Isso aponta para um hardware neuromórfico futuro que aprende continuamente, resiste ao esquecimento e executa modelos de IA poderosos com muito menos energia do que as plataformas existentes.

Citação: Wen, Z., Zhang, Q., Chen, J. et al. Computing-in-memory architecture for Kolmogorov-Arnold networks based on tunable Gaussian-like memory cells. Nat Commun 17, 3496 (2026). https://doi.org/10.1038/s41467-026-69592-w

Palavras-chave: computação neuromórfica, computação em memória, redes de Kolmogorov-Arnold, dispositivos memristores, hardware de IA energeticamente eficiente