Clear Sky Science · sv
Femtojoule-tröskel rekonfigurerbara heloptiska icke-linjära aktivatorer för pikosekundspulsade optiska neurala nätverk
Varför små ljuspulser kan driva framtidens AI
Dagens artificiella intelligens körs på stora anläggningar av strömslukande elektroniska chip. När vi kräver smartare telefoner, bilar och datacenter blir elförbrukning och värme stora hinder. Denna artikel rapporterar ett sätt att utföra en del av det tunga arbetet med ljus i stället för elektroner, med hjälp av små optiska komponenter som fungerar som ”aktiverings”omkopplare i ett neuralt nätverk. Dessa omkopplare arbetar med otroligt små ljusenergier och i blixtrande hastigheter, och visar möjligheten till ultrarapid, energieffektiv AI-hårdvara.
Från långsam, het elektronik till snabb, sval fotonik
Konventionella datorchip flyttar elektriska laddningar genom metalltrådar och transistorer. Den metoden har tjänat oss väl, men närmar sig gränser både i hastighet och energieffektivitet. Optiska neurala nätverk ersätter rörliga laddningar med fotoner som färdas i vågledare—i praktiken små ljusleder på chipet. Ljus kan bära information snabbt, i många färger samtidigt, och med liten uppvärmning. Men för att bygga ett praktiskt heloptiskt neuralt nätverk krävs en viktig ingrediens: en kompakt komponent som tar in en ljussignal och skickar ut en transformerad version av den på ett icke-linjärt sätt, precis som en biologisk neuron bara avfyrar när ingången passerar en tröskel. Hittills har sådana heloptiska ”aktiverings”element tenderat att vara för stora, för långsamma eller för energikrävande.

En mikroskopisk ljusfälla som lär sig att böja signaler
Författarna konstruerar först en kisel fotonkristallkavitet—en perforerad kiselskiva som fångar och fördröjer ljus vid specifika våglängder. Genom att noggrant arrangera en rad hål skapar de en liten region där en kort ljuspuls kan resonera och bygga upp sin intensitet. Detta förstärker en subtil egenskap hos kisel kallad Kerr-effekt, där materialets brytningsindex ändras något när ljuset inuti blir intensivt. Den lilla förändringen skjuter cavityns favoriserade våglängd och förändrar därmed hur mycket av en passerande ljuspuls som kommer igenom. Genom att välja ingångsvåglängd relativt till kavitetens resonansmaximum kan forskarna få enheten att bete sig som flera olika aktiveringskurvor som används i maskininlärning, inklusive linjära, ReLU‑liknande (rektifierad linjär) och sigmoid‑liknande respons. Även i denna helt kiselsbaserade version är aktivatorn bara cirka 15 mikrometer gånger 10 mikrometer—mindre än ett dammkorn—och reagerar på under 2 biljondelar av en sekund.
Lägga till grafen för ultralåg energiomkoppling
För att sänka aktiveringströskeln ytterligare integrerar teamet ett ettatomslager grafen ovanpå kiselkaviteten. Grafen absorberar ljus naturligt, men vid höga intensiteter mättas absorptionen: när många elektroner är exciterade kan ytterligare fotoner passera lättare. Genom att kombinera denna ”mättnadsabsorption” med kavitetens slow‑light‑förstärkning når enheten en saturationsenergi på endast 4 femtojoule—ungefär energin hos några tiotusentals telekomfoton—och en responstid på cirka 1 pikosekund. Vid närliggande våglängder kan samma struktur fortfarande utnyttja kisels Kerr‑effekt för att på begäran forma om sin aktiveringskurva, växla mellan sigmoid‑liknande, ReLU‑liknande och nästan linjära beteenden med trösklar så låga som 30 femtojoule. Vad gäller hastighet och nödvändig energi överträffar denna figur av förtjänst tidigare on‑chip optiska aktivatorer med flera storleksordningar.

Bygga en pulserande optisk hjärna på ett chip
Genom att använda dessa aktivatorer som byggstenar skisserar författarna en fullständig optisk neural nätverksarkitektur som drivs av ultrafasta ljuspulser i stället för kontinuerliga strålar. En högrepetitionsfrekvent pulslaser genererar en rad pikosekundspikar, vilka kodas med data av högspeedmodulatorer och sedan delas över många våglängder. På chipet dirigerar specialiserade wavelength‑division‑komponenter och viktar dessa färger med icke‑flyktiga fasövergångsmaterial som bibehåller sina inställningar utan att förbruka energi. Efter linjär viktning passerar signalerna genom grafen‑kisel‑aktivatorerna, som avtrycker önskad icke‑linjär respons innan ljuset leds vidare till nästa lager. Simuleringar visar att med aktiveringsenergier under cirka 30 femtojoule kan ett sådant system nå beräkningsdensiteter runt 10³ biljoner operationer per sekund per kvadratmillimeter och energieffektivitet nära 10⁶ biljoner operationer per watt per kvadratmillimeter—långt bortom typiska elektroniska acceleratorer.
Vad detta betyder för vardaglig AI
För att testa om dessa exotiska optiska aktiveringar beter sig som sina elektroniska motsvarigheter matar teamet sina uppmätta aktiveringskurvor in i mjukvarumodeller och tränar dem på standardklassificeringsuppgifter, från enkla tvådimensionella mönster till handskrivna siffror (MNIST) och komplexa färgbilder (CIFAR‑10). Grafen‑kisel‑aktiveringar matchar eller överträffar enkla linjära responser, särskilt på de svårare bilduppgifterna där ReLU‑liknande beteende visar sig särskilt kraftfullt. Enkelt uttryckt visar detta arbete att ett tumnagelsstort chip av noggrant strukturerad kisel och grafen en dag skulle kunna hantera nyckelsteg i AI‑beräkningar med små ljuspulser i stället för elektricitet. Om det skalas upp och integreras med mogna fotoniska teknologier kan sådana heloptiska icke‑linjära aktivatorer bidra till snabbare, svalare och mer effektiva komponenter för nästa generations artificiella intelligens.
Citering: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4
Nyckelord: optiska neurala nätverk, grafenfotonik, fotonkristallkavitetter, icke-linjär aktivering, energieffektiv AI-hårdvara