Clear Sky Science · pt
Computação de Dados in-situ com Arquitetura de Um-Pixel-Múltiplos-Memristores para Visão Sequencial Neuromórfica
Por que uma visão mais rápida importa
Cada vez que uma câmera em um telefone, robô ou carro autônomo registra o mundo, ela precisa primeiro capturar imagens e depois enviá‑las para um chip separado para análise. Esse vai e vem desperdiça tempo e energia, especialmente para fluxos de vídeo. O estudo por trás deste artigo explora um novo tipo de “olho” eletrônico que pode tanto armazenar quanto processar informação visual quase no ponto em que a luz incide, tomando emprestado a inspiração de como o cérebro humano lida com cenas em movimento.
Como nossos olhos e cérebro lidam com o movimento
Nas pessoas, o olho converte a luz em pequenos pulsos elétricos que viajam pelos nervos até o cérebro. Lá, uma espécie de memória visual de curto prazo retém imagens recentes e faz uma pré‑triagem rápida antes do reconhecimento mais profundo. Essa filtragem inicial reduz a quantidade de informação que precisa ser movimentada, ajudando o cérebro a ser rápido e energeticamente eficiente. O novo trabalho aproveita essa ideia, visando dar a sistemas de visão artificial sua própria memória de trabalho visual local.

Uma nova parceria entre pixel e memória
Os pesquisadores construíram um sistema de hardware no qual cada pixel sensível à luz está ligado a muitos pequenos elementos de memória em um chip. Esses elementos, chamados memristores, podem armazenar uma gama de valores, não apenas ligado e desligado, o que os torna bem adequados para guardar nuances de brilho. No desenho, um circuito analógico simples converte o sinal de luz do pixel em uma voltagem que programa diretamente vários memristores ao mesmo tempo. Esse arranjo de um pixel para múltiplos memristores cria um mapa compacto da cena diretamente na grade de memória, semelhante a como fibras nervosas da retina se espalham por muitas células cerebrais.
Rolar pelas imagens rapidamente
Para capturar imagens em movimento de forma eficiente, a equipe introduziu uma estratégia de “exposição rolante”. Em vez de capturar um quadro inteiro e enviá‑lo, o sistema grava uma coluna de pixels na matriz de memristores e então avança rapidamente para a próxima coluna até que a imagem completa esteja armazenada. Um método especial de pulso único programa muitos memristores em paralelo, trocando um pouco de precisão por um grande ganho de velocidade. Testes com silhuetas de ações humanas simples e um retrato mostram que as imagens restauradas do chip mantêm formas e rostos principais claras o bastante para reconhecimento confiável, mesmo que algum ruído pequeno esteja presente.

Pensando onde as imagens residem
A maior parte do hardware de visão inteligente atual ainda separa sensoriamento, armazenamento e computação. Em contraste, esse sistema realiza parte do “processamento” diretamente na mesma matriz de memristores que contém a imagem. Os pesquisadores aplicam padrões de voltagem cuidadosamente escolhidos sobre a imagem armazenada, permitindo que a própria grade execute os passos matemáticos básicos de uma rede neural. Apenas os resultados condensados então viajam para um segundo bloco de memristores que conclui a classificação. Em testes com um conhecido conjunto de dados de ações humanas, o hardware reconheceu movimentos como correr, pular e caminhar com 95,7% de acurácia, próximo às simulações em computador.
Por que essa abordagem pode remodelar os olhos das máquinas
Como sensoriamento, armazenamento de curto prazo e processamento inicial estão intimamente integrados, a nova arquitetura reduz muito a necessidade de transferir dados entre chips separados. Os autores estimam que seu projeto pode reduzir o atraso no tempo entre captura e armazenamento da imagem em cerca de dois mil vezes, e cortar o consumo de energia para processamento de imagens em aproximadamente 160 vezes em comparação com um sistema digital típico usando memória convencional. Para usuários do dia a dia, isso poderia se traduzir algum dia em câmeras e dispositivos guiados por visão menores, mais frios e mais responsivos, que observam o mundo de forma mais parecida com a nossa, extraindo apenas o que precisam de cada momento no tempo.
Citação: Sun, Y., Tong, P., Shen, J. et al. Data-In-situ Computing with One-Pixel-Multiple-Memristor Architecture for Neuromorphic Sequential Vision. Nat Commun 17, 4244 (2026). https://doi.org/10.1038/s41467-026-70860-y
Palavras-chave: visão neuromórfica, memristor, computação em memória, imagens sequenciais, IA energeticamente eficiente