Clear Sky Science · pt

Processador fotônico multiplicador de matrizes em uma única passagem baseado em difração hipermultiplexada espaço-espectral

2026-01-13 · Voltar ao índice

Por que um processamento mais rápido e mais verde importa

Cada vez que fazemos uma pergunta a um assistente digital ou rolamos pelas redes sociais, modelos poderosos de inteligência artificial trabalham nos bastidores. Esses modelos estão ficando tão grandes que os chips convencionais têm dificuldade de acompanhá‑los sem consumir enormes quantidades de energia. Este artigo descreve um novo tipo de hardware de computação que usa luz em vez de eletricidade para realizar cálculos essenciais de IA, com o objetivo de tornar máquinas futuras tanto mais rápidas quanto muito mais eficientes energeticamente.

Transformando luz em calculadora

A IA moderna opera com operações chamadas multiplicações de matrizes, repetidas bilhões ou trilhões de vezes quando uma rede neural analisa imagens ou texto. Chips eletrônicos realizam esse trabalho de forma confiável, mas desperdiçam muita energia simplesmente movendo dados para frente e para trás dentro do chip. Os pesquisadores deste estudo partem de uma ideia diferente: deixar que a própria luz faça a matemática. Em uma rede neural óptica, a informação é codificada em feixes de laser, manipulada enquanto os feixes passam por lentes e moduladores e então lida por sensores de luz. Como os fótons não aquecem fios da mesma forma que elétrons, tais sistemas podem, em princípio, alcançar velocidades e eficiências muito maiores.

Fazendo muitos cálculos em uma única passagem

A maioria das redes neurais ópticas existentes tem uma limitação: elas só conseguem processar um número modesto de cálculos em paralelo, ou se tornam complexas demais para escalar. Este trabalho introduz um processador fotônico de matriz–matriz em “passagem única” que aumenta dramaticamente quantas operações podem ser feitas de uma vez. A ideia-chave é empacotar informação em três aspectos diferentes da luz simultaneamente — sua posição no espaço, sua cor (comprimento de onda) e seu tempo. Ao organizar cuidadosamente essas dimensões, o dispositivo pode executar uma multiplicação completa de matriz–matriz, envolvendo milhares de etapas de multiplicar-e-acumular, em uma única passagem da luz pelo sistema.

Uma grade de difração como controlador de tráfego para a luz

No coração do projeto está um elemento óptico simples, porém poderoso: uma grade de difração, que divide a luz em diferentes ângulos conforme sua cor. A equipe usa um sistema de grades tridimensionais arranjadas como um controlador de tráfego, roteando muitos feixes coloridos vindos de vários canais de entrada para canais de saída reordenados. Os dados a serem processados são codificados como intensidades de luz em um conjunto de moduladores, enquanto os “pesos” da rede neural são codificados em outro conjunto. Quando os feixes se encontram e passam pela grade, seus caminhos são rearranjados de modo que cada canal de saída soma naturalmente as combinações corretas de dados e pesos. Detectores de integração temporal então acumulam contribuições ao longo de vários passos de tempo curtos, ampliando efetivamente o tamanho do cálculo sem adicionar complexidade extra à óptica.

Do ensaio de laboratório às tarefas reais de IA

Os autores demonstram um processador tensorial óptico 16‑por‑16‑por‑16‑por‑16, o que significa que ele pode multiplicar uma matriz 16×16 por outra 16×16 em um único “tiro” óptico, realizando 4096 operações básicas ao mesmo tempo. O sistema opera em taxas de clock multigigahertz e alcança uma precisão computacional efetiva de mais de oito bits, comparável a muitos aceleradores de IA práticos. Para mostrar que não se trata apenas de uma demonstração física, eles usam o processador para executar partes de um pipeline pequeno de reconhecimento de imagens: uma rede neural convolucional que extrai características de imagens de dígitos, seguida por uma rede totalmente conectada que os classifica. Mesmo com ruído óptico e imperfeições do hardware, o conjunto reconhece corretamente dígitos manuscritos com cerca de 96% de acurácia, próximo de uma implementação totalmente digital do mesmo modelo.

Uso de energia, sensibilidade e até onde isso pode escalar

Como a arquitetura reutiliza os mesmos componentes ópticos em muitos canais paralelos e acumula sinais de forma eficiente, cada operação básica pode ser executada com energia extremamente baixa — até dezenas de attojoules de energia óptica por multiplicação. Os autores estimam uma eficiência energética geral que já supera alguns aceleradores eletrônicos de IA de ponta e argumentam que melhorias moderadas em moduladores e conversores digital‑para‑analógico poderiam levar isso a centenas de trilhões de operações por segundo por watt. É importante notar que o projeto evita alguns dos obstáculos de escalabilidade que afetam outros esquemas ópticos, portanto versões maiores com muito mais canais (por exemplo, matrizes 30×30 ou até 60×60) parecem viáveis usando componentes semelhantes.

O que isso significa para a tecnologia do dia a dia

Em termos simples, esta pesquisa mostra que um arranjo óptico relativamente simples — uma maneira inteligente de roteamento de feixes de luz colorida através de uma grade de difração — pode atuar como um motor poderoso e de baixa energia para cálculos no estilo IA. Embora ainda seja um protótipo de laboratório, aponta para futuros data centers e dispositivos de borda onde processadores baseados em luz lidariam com as cargas de trabalho mais pesadas de redes neurais, reduzindo contas de energia e permitindo modelos maiores e mais rápidos. Se tais processadores tensoriais fotônicos puderem ser integrados e fabricados em escala, eles podem se tornar um ingrediente-chave na próxima geração de hardware de inteligência artificial de alto desempenho e eficiência energética.

Citação: Luan, C., Davis III, R., Chen, Z. et al. Single-shot matrix-matrix photonic processor based on spatial-spectral hypermultiplexed parallel diffraction. Nat Commun 17, 484 (2026). https://doi.org/10.1038/s41467-026-68452-x

Palavras-chave: redes neurais ópticas, computação fotônica, multiplicação de matrizes, hardware de IA energeticamente eficiente, rede de difração