Clear Sky Science · it

Soglie da femtojoule per attivatori non lineari all‑ottici riconfigurabili per reti neurali ottiche a impulsi picosecondo

· Torna all'indice

Perché piccoli lampi di luce potrebbero alimentare l’IA del futuro

L’intelligenza artificiale odierna gira su vaste fattorie di chip elettronici ad alto consumo energetico. Man mano che chiediamo telefoni, auto e data center più intelligenti, l’elettricità e il calore diventano ostacoli importanti. Questo articolo descrive un modo per svolgere parte di quel lavoro pesante con la luce anziché con gli elettroni, usando minuscoli dispositivi ottici che funzionano come gli “interruttori di attivazione” in una rete neurale. Questi interruttori operano con energie luminose incredibilmente basse e a velocità fulminee, offrendo uno sguardo su hardware per l’IA ultrarapido ed efficiente dal punto di vista energetico.

Dall’elettronica lenta e calda alla fotonica veloce e fredda

I chip convenzionali spostano cariche elettriche attraverso fili metallici e transistor. Questo approccio ci ha servito bene, ma sta raggiungendo limiti sia nella velocità sia nell’efficienza energetica. Le reti neurali ottiche sostituiscono le cariche in movimento con fotoni che viaggiano in guide d’onda—in pratica minuscoli percorsi luminosi sul chip. La luce può trasportare informazioni rapidamente, in molti colori contemporaneamente e con poco riscaldamento. Tuttavia, costruire una rete neurale completamente ottica pratica richiede un ingrediente chiave: un dispositivo compatto che riceva un segnale luminoso e restituisca una versione trasformata in modo non lineare, proprio come un neurone che si attiva solo quando l’ingresso supera una soglia. Finora, questi elementi di “attivazione” completamente ottici tendevano a essere troppo grandi, troppo lenti o troppo dispendiosi in termini di potenza.

Figure 1
Figure 1.

Una trappola di luce microscopica che impara a piegare i segnali

Gli autori innanzitutto progettano una cavità a cristallo fotonico in silicio—una lastra perforata di silicio che intrappola e rallenta la luce a colori specifici. Disporre con cura una fila di fori crea una piccola regione in cui un impulso luminoso breve può risuonare, accumulando intensità. Questo potenzia una proprietà sottile del silicio chiamata effetto Kerr, per cui l’indice di rifrazione del materiale cambia leggermente quando la luce interna diventa intensa. Quel piccolo cambiamento sposta il colore preferito della cavità e, di conseguenza, modifica quanto di un impulso luminoso in transito la attraversa. Scegliendo la lunghezza d’onda d’ingresso rispetto al picco di risonanza della cavità, i ricercatori possono far comportare il dispositivo come diverse curve di attivazione usate nell’apprendimento automatico, incluse risposte lineari, simili a ReLU (lineare rettificata) e simili a sigmoide. Anche in questa versione puramente in silicio, l’attivatore misura solo circa 15 micrometri per 10 micrometri—più piccolo di un granello di polvere—e risponde in meno di 2 trilionesimi di secondo.

Aggiungere grafene per commutazioni a energia ultra‑bassa

Per abbassare ulteriormente la soglia di attivazione, il team integra uno strato di grafene spesso un solo atomo sopra la cavità in silicio. Il grafene assorbe naturalmente la luce, ma a intensità elevate la sua assorbimento si satura: una volta che molti elettroni sono eccitati, i fotoni aggiuntivi possono passare più facilmente. Combinando questa “assorbimento saturabile” con l’incremento dovuto alla luce rallentata nella cavità, il dispositivo raggiunge un’energia di saturazione di appena 4 femtojoule—più o meno l’energia trasportata da alcune decine di migliaia di fotoni telecom—e un tempo di risposta di circa 1 picosecondo. A lunghezze d’onda vicine, la stessa struttura può ancora sfruttare l’effetto Kerr del silicio per rimodellare la sua curva di attivazione a richiesta, passando tra comportamenti simili a sigmoide, a ReLU e quasi lineari con soglie basse fino a 30 femtojoule. In termini di velocità ed energia richiesta, questa cifra di merito supera di diversi ordini di grandezza i precedenti attivatori ottici integrati su chip.

Figure 2
Figure 2.

Costruire un cervello ottico a impulsi su un chip

Usando questi attivatori come mattoni, gli autori delineano un’architettura completa di rete neurale ottica guidata da impulsi luminosi ultraveloci anziché da fasci continui. Un laser pulsato ad alta frequenza di ripetizione genera una serie di picchi picosecondo, che vengono codificati con dati da modulatori ad alta velocità e poi suddivisi su molte lunghezze d’onda. Sul chip, componenti specializzati per la divisione in lunghezze d’onda instradano e pesano questi colori utilizzando materiali a cambiamento di fase non volatili che ricordano le impostazioni senza consumare energia. Dopo il peso lineare, i segnali passano attraverso gli attivatori grafene‑silicio, che imprimono la risposta non lineare desiderata prima che la luce venga instradata allo strato successivo. Le simulazioni mostrano che, con energie di attivazione inferiori a circa 30 femtojoule, un sistema del genere potrebbe raggiungere densità computazionali dell’ordine di 10³ trilioni di operazioni al secondo per millimetro quadrato e efficienze energetiche vicine a 10⁶ trilioni di operazioni per watt per millimetro quadrato—ben oltre gli acceleratori elettronici tipici.

Cosa significa per l’IA di tutti i giorni

Per verificare se queste esotiche attivazioni ottiche si comportano come le loro controparti elettroniche, il team inserisce le curve di attivazione misurate in modelli software e le addestra su compiti di classificazione standard, da semplici pattern bidimensionali a cifre manoscritte (MNIST) e immagini a colori complesse (CIFAR‑10). Le attivazioni grafene‑silicio si equiparano o superano le risposte lineari semplici, in particolare nei task di immagine più difficili, dove il comportamento simile a ReLU si dimostra particolarmente efficace. In termini pratici, questo lavoro mostra che un chip delle dimensioni di un’unghia, di silicio e grafene accuratamente strutturato, potrebbe un giorno svolgere passaggi chiave nei calcoli di IA usando piccoli lampi di luce anziché elettricità. Se scalato e integrato con tecnologie fotoniche mature, tali attivatori non lineari completamente ottici potrebbero contribuire a offrire hardware più veloce, più fresco e più efficiente per le prossime generazioni di intelligenza artificiale.

Citazione: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4

Parole chiave: reti neurali ottiche, fotonica a grafene, cavità a cristallo fotonico, attivazione non lineare, hardware AI a basso consumo energetico