Clear Sky Science · pt

Sínapses spintrônicas multibit escaláveis e robustas para computação analógica in‑memory

· Voltar ao índice

Por que memórias mais inteligentes importam para a IA do dia a dia

De assistentes de voz a aplicativos de fotos, a inteligência artificial moderna depende fortemente de redes neurais profundas — programas que manipulam milhões de pequenos “pesos” numéricos para tomar decisões. Mover esses pesos entre a memória e os processadores consome muito mais energia do que os próprios cálculos. Este artigo explora um novo tipo de célula de memória magnética que pode tanto armazenar esses pesos quanto contribuir para realizar os cálculos diretamente onde os dados residem, prometendo hardware de IA mais rápido e eficiente.

Trazer computação semelhante ao cérebro para o chip de memória

Os computadores atuais seguem o esquema clássico von Neumann, em que os dados ficam constantemente sendo transferidos entre a memória e um processador separado. Redes neurais, que se resumem a enormes quantidades de multiplicações matriz–vetor, esbarram fortemente nesse gargalo. Uma alternativa promissora é a computação in‑memory, em que uma grande grade (uma matriz cruzada) de células de memória armazena os pesos da rede e simultaneamente converte tensões de entrada em correntes de saída que representam os cálculos. Muitos dispositivos de memória experimentais foram testados para esse papel, mas frequentemente apresentam comportamento ruidoso e deriva de valores, o que é arriscado quando cada célula precisa representar mais do que apenas 0 ou 1.

Figure 1
Figure 1.

Transformando a memória magnética de ligado–desligado para “analógica”

Os autores partem da memória de acesso aleatório magnética (MRAM), uma tecnologia não volátil já valorizada por velocidade, durabilidade e compatibilidade com processos padrão de fabricação de chips. Uma célula MRAM convencional é uma junção túnel magnética: duas camadas magnéticas separadas por uma barreira isolante. Dependendo de as camadas estarem alinhadas ou opostas, a resistência elétrica da célula é baixa ou alta, codificando um único bit. A diferença chave aqui é redesenhar a camada magnética “livre” para que ela não seja mais um bloco uniforme que inverte por completo. Em vez disso, o novo projeto combina um filme contínuo muito fino sobre uma camada magnética granular mais espessa composta por muitos pequenos grãos magnéticos. Cada grão pode inverter sua direção em correntes ligeiramente diferentes, de modo que a resistência global possa assumir vários níveis intermediários estáveis em vez de apenas “baixo” e “alto”.

Quantos níveis de magnetismo são úteis?

Usando modelos computacionais detalhados da dinâmica magnética, a equipe mostra que injetar uma corrente polarizada em spin nessa camada composta provoca um processo gradual de inversão grão a grão. À medida que a corrente é variada, a magnetização média e, portanto, a resistência descrevem uma curva em S suave, possibilitando estados analógicos quase contínuos. Os autores então examinam como diferenças de fabricação entre células e efeitos térmicos aleatórios de um ciclo de escrita para o outro perturbam esses níveis. Eles constatam que, enquanto os estados intermediários são um tanto mais ruidosos, os estados extremos (totalmente invertidos em uma direção ou na outra) permanecem muito estáveis e robustos. Para dispositivos com tamanhos realistas (cerca de 50–75 nanômetros de lado), concluem que quatro níveis de resistência distintamente confiáveis — equivalentes a 2 bits por célula — são práticos sem erros excessivos.

Figure 2
Figure 2.

Da célula única ao acelerador de IA completo

Para ser útil, esse MRAM multinível deve ser lido com precisão e integrado a sistemas de computação completos. Os autores projetam e simulam um circuito de detecção que usa um conversor analógico‑para‑digital rápido do tipo “flash” para distinguir entre os quatro níveis de resistência de cada célula. Eles exploram como o contraste entre os estados de maior e menor condutância afeta a velocidade de leitura, o consumo de energia e o tamanho do circuito de detecção, mostrando que melhor contraste leva diretamente a leituras mais rápidas e energeticamente eficientes. Em seguida, incorporam seu modelo de MRAM de 2 bits por célula a um acelerador in‑memory simulado executando uma rede ResNet‑18 no conjunto de imagens CIFAR‑10. Em comparação com uma linha de base que usa células MRAM padrão de 1 bit, a versão multibit aproximadamente dobra a densidade de armazenamento e reduz pela metade o número necessário de blocos cruzados. Isso se traduz em reduções de até cerca de 1,8× na área de chip, energia e latência, e mais de 3× de melhoria na métrica combinada energia–atraso, tudo isso preservando essencialmente a precisão de reconhecimento da rede.

Como isso se compara a outras ideias de memória

O estudo também compara essa abordagem com tecnologias concorrentes como memória resistiva e memória de mudança de fase, além de outros conceitos magnéticos que dependem de movimento de paredes de domínio ou skyrmions. Embora essas alternativas também possam produzir comportamento parecido com analógico, frequentemente exigem dispositivos maiores ou formas especiais e tendem a ser mais imprevisíveis. Em contraste, as células MRAM granulares mantêm a facilidade de fabricação e a resistência da MRAM convencional enquanto ganham níveis adicionais de armazenamento. Testes em nível de sistema sugerem que, sob variações realistas, sinapses baseadas em MRAM preservam a precisão das redes neurais muito melhor do que projetos semelhantes construídos sobre memórias resistivas mais variáveis, especialmente quando as redes são esparsificadas para economizar ainda mais energia.

O que isso significa para a IA cotidiana do futuro

Em termos claros, os autores demonstraram uma maneira de ensinar uma tecnologia magnética de memória comprovada a armazenar não apenas zeros e uns, mas pequenos valores de peso analógico diretamente dentro de uma célula compacta. Ao engenheirar cuidadosamente uma estrutura em camadas que distribui o comportamento magnético por muitos grãos minúsculos, obtiveram múltiplos níveis estáveis de resistência suficientemente robustos para tarefas de IA no mundo real. Quando essas células são organizadas em grandes matrizes e combinadas com circuitos de detecção adequados, elas podem executar os cálculos centrais do aprendizado profundo enquanto reduzem drasticamente o movimento de dados. Se implementadas em hardware, tais sinapses spintrônicas multibit poderiam tornar sistemas de IA futuros — seja em data centers, smartphones ou sensores embarcados — mais rápidos e energeticamente eficientes sem sacrificar a precisão.

Citação: Gupte, K.K., Mugdho, S.S., Huang, C. et al. Scalable and robust multi-bit spintronic synapses for analog in-memory computing. npj Unconv. Comput. 3, 8 (2026). https://doi.org/10.1038/s44335-026-00055-7

Palavras-chave: computação in‑memory, memória spintrônica, MRAM, hardware neuromórfico, redes neurais profundas