Clear Sky Science · nl

Femtojoule-drempel configureerbare volledig-optische niet-lineaire activatoren voor picoseconde gepulseerde optische neurale netwerken

· Terug naar het overzicht

Waarom kleine lichtuitbarstingen de AI van de toekomst kunnen aandrijven

De hedendaagse kunstmatige intelligentie draait op uitgestrekte clusters van energieverslindende elektronische chips. Naarmate we slimmere telefoons, auto’s en datacenters willen, worden stroomverbruik en warmte belangrijke knelpunten. Dit artikel beschrijft een manier om een deel van dat zware werk met licht in plaats van elektronen te doen, met behulp van minuscule optische apparaten die fungeren als de "activatie"-schakelaars in een neurale netwerk. Deze schakelaars werken met zeer kleine lichtenergieën en met razendsnelle snelheden, en tonen een blik op ultrakorte, energiezuinige AI-hardware.

Van trage, hete elektronica naar snelle, koele fotonica

Conventionele computerchips verplaatsen elektrische ladingen door metalen draden en transistoren. Die aanpak heeft ons goed gediend, maar bereikt limieten in zowel snelheid als energie-efficiëntie. Optische neurale netwerken vervangen bewegende ladingen door fotonen die door golfgeleiders reizen — in wezen kleine lichtpaden op een chip. Licht kan informatie snel vervoeren, in veel kleuren tegelijk, en met weinig warmteontwikkeling. Het bouwen van een praktisch volledig-optisch neuraal netwerk vereist echter een sleutelcomponent: een compact apparaat dat een lichtsignaal inleest en er op een niet-lineaire manier een getransformeerde versie van uitstuurt, net zoals een neuron in de hersenen alleen vuurt wanneer de input een drempel overschrijdt. Tot nu toe waren zulke volledig-optische "activatie"-elementen vaak te groot, te traag of te energie-intensief.

Figure 1
Figuur 1.

Een microscopische lichtval die leert signalen te buigen

De auteurs ontwerpen eerst een silicium fotonische kristalkamer — een geperforeerde siliciumplaat die licht bij specifieke kleuren opvangt en vertraagt. Door zorgvuldig een rij gaatjes te rangschikken creëren ze een klein gebied waar een korte lichtpuls kan resoneren en in intensiteit opbouwen. Dat versterkt een subtiele eigenschap van silicium, het Kerr-effect, waarbij de brekingsindex van het materiaal lichtelijk verandert als het binnenkomende licht intens wordt. Die kleine verandering verschuift de resonantiekleur van de kamer en beïnvloedt daardoor hoeveel van een passerende lichtpuls doorgelaten wordt. Door de invoergolflengte ten opzichte van de resonantiepieknauwkeurig te kiezen, kunnen de onderzoekers het apparaat laten functioneren als meerdere activatiefuncties die in machine learning worden gebruikt, waaronder lineair, ReLU-achtig (gerectificeerd lineair) en sigmoid-achtige responsen. Zelfs in deze puur siliciumversie is de activator slechts ongeveer 15 micrometer bij 10 micrometer — kleiner dan een stofdeeltje — en reageert hij in minder dan 2 biljoensten van een seconde.

Graphene toevoegen voor ultralaag-energiewisselen

Om de activatiedrempel nog lager te brengen, integreert het team een enkele-atoom-dikke laag graphene bovenop de siliciumkamer. Graphene absorbeert van nature licht, maar bij hoge intensiteiten raakt die absorptie verzadigd: zodra veel elektronen geëxciteerd zijn, kunnen extra fotonen gemakkelijker passeren. Door deze "verzadigbare absorptie" te combineren met de slow-light versterking van de kamer bereikt het apparaat een saturatie-energie van slechts 4 femtojoule — grofweg de energie van enkele tienduizenden telecomm-fotonen — en een responstijd van ongeveer 1 picoseconde. Bij nabijgelegen golflengten kan dezelfde structuur nog steeds gebruikmaken van het Kerr-effect van silicium om zijn activatiecurve on demand te vervormen, waardoor geschakeld kan worden tussen sigmoid-achtige, ReLU-achtige en bijna-lineaire gedragingen met drempels zo laag als 30 femtojoule. Wat snelheid en benodigde energie betreft, overtreft deze prestatiemaat de vorige on-chip optische activatoren met meerdere grootteordes.

Figure 2
Figuur 2.

Een gepulseerde optische "hersenen" op een chip bouwen

Met deze activatoren als bouwstenen schetsen de auteurs een volledige optische neurale netwerkarchitectuur die wordt aangedreven door ultrakorte lichtpulsen in plaats van continue bundels. Een hoog-repetitiefrequentie gepulseerde laser genereert een reeks picoseconde-spikes, die met data worden gecodeerd door hogesnelheidsmodulatoren en vervolgens over veel golflengten worden verdeeld. Op de chip leiden gespecialiseerde golflengte-deling-componenten deze kleuren en wegen ze met niet-vluchtige faseveranderende materialen die hun instellingen onthouden zonder stroom te verbruiken. Na lineaire wegen passeren de signalen de graphene-silicium activatoren, die de gewenste niet-lineaire respons afdrukken voordat het licht naar de volgende laag wordt geleid. Simulaties tonen aan dat, met activatie-energieën onder ongeveer 30 femtojoule, zo’n systeem reken­dichtheden van rond 10^3 biljoen bewerkingen per seconde per vierkante millimeter en energie-efficiënties dichtbij 10^6 biljoen bewerkingen per watt per vierkante millimeter zou kunnen bereiken — ver buiten het bereik van typische elektronische versnellers.

Wat dit betekent voor alledaagse AI

Om te testen of deze exotische optische activaties zich gedragen als hun elektronische tegenhangers, voeren de onderzoekers hun gemeten activatiecurven in softwaremodellen en trainen ze op standaard classificatietaken, van eenvoudige tweedimensionale patronen tot handgeschreven cijfers (MNIST) en complexe kleurafbeeldingen (CIFAR-10). De graphene-silicium activaties evenaren of overtreffen eenvoudige lineaire responsen, vooral bij de moeilijkere beeldtaken, waar ReLU-achtig gedrag bijzonder krachtig blijkt. In eenvoudige bewoordingen toont dit werk aan dat een duimnagelgroot chipje van zorgvuldig gestructureerd silicium en graphene op een dag sleutelstappen in AI-berekeningen zou kunnen uitvoeren met kleine lichtpulsen in plaats van elektriciteit. Als dit opgeschaald en geïntegreerd wordt met rijpe fotonische technologieën, zouden dergelijke volledig-optische niet-lineaire activatoren kunnen bijdragen aan snellere, koelere en efficiëntere hardware voor de volgende generaties kunstmatige intelligentie.

Bronvermelding: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4

Trefwoorden: optische neurale netwerken, graphene-fotonica, fotonsiche kristalkaviteiten, niet-lineaire activatie, energie-efficiënte AI-hardware