Clear Sky Science · sv

Integrerad fotonisk 3D-tensorbearbetningsmotor

· Tillbaka till index

Varför snabbare tänkande maskiner spelar roll

Från självkörande bilar till medicinska skannrar och virtuell verklighet förlitar sig vår värld i allt högre grad på datorer som kan tolka komplex, tredimensionell data i realtid. Dagens artificiella intelligenssystem är kraftfulla, men de elektroniska kretsarna som driver dem pressas hårt av kraven på allt större och snabbare neurala nätverk. Den här artikeln presenterar ett nytt sätt att hantera sådan 3D-data med ljus i stället för elektricitet, vilket lovar snabbare och effektivare ”tänkande” maskiner som så småningom kan göra bilar säkrare, diagnoser snabbare och onlinemiljöer mer uppslukande.

Från plana bilder till 3D-världar

Många välkända AI-system arbetar med plana bilder—tvådimensionella pixelraster—med vad som kallas konvolutionella neurala nätverk. Men moderna sensorer, som medicinska skannrar och laserbaserad LiDAR på autonoma fordon, fångar fullständiga 3D-scener över tid. Dessa rikare datamängder beskrivs naturligt som ”tensorer”, eller flerdimensionella arrayer. Att bearbeta dem med 3D-neurala nätverk är mycket kraftfullt men också mycket krävande: mängden beräkning och minne som behövs växer snabbt med varje extra dimension. Konventionella elektroniska acceleratorer som GPU:er och TPU:er är i huvudsak byggda för att hantera plana, tvådimensionella matrisoperationer, så de måste ständigt omforma och flytta 3D-data, vilket slösar tid, energi och minne.

Figure 1
Figure 1.

Låt ljuset göra det tunga lyftet

Forskarna presenterar en integrerad fotonisk 3D-tensorbearbetningsmotor som utför ett nyckelsteg i 3D-neurala nätverk direkt med ljus. I stället för att upprepade gånger flytta data mellan minne och elektroniska processorer skickar deras system information som optiska signaler som färdas genom små vågledare och resonatorer på ett chip. Tre olika ”axlar” används för att koda och bearbeta data samtidigt: ljusets färg (våglängd), tiden då pulser passerar, och de fysiska banorna de tar över chippet. Genom att sammanfläta dessa tre dimensioner kan systemet hantera fullständiga 3D-konvolutioner utan att dela upp dem i många mindre uppgifter eller förlita sig på skrymmande elektronisk styrhårdvara.

Inbyggt optiskt minne och synkronisering

En central utmaning i höghastighetsberäkningar är att hålla många datakanaler exakt i fas tidsmässigt. Traditionella system använder komplexa elektroniska klockkretsar och stora buffer-minnen för detta. Här löser teamet problemet helt i det optiska domänen. De lägger till två optiska minnesenheter, uppbyggda av ställbara fördröjningslinjer, före och efter huvudberäkningsblocket. Dessa fördröjningslinjer fungerar som justerbara väntplatser för ljuspulser och låter systemet ”cache:a” data och synkronisera kanaler genom att helt enkelt ändra hur länge varje puls färdas på chippet. Fördröjningarna kan finjusteras med pikosekundprecision (biljondelar av en sekund) och stödja effektiva klockfrekvenser upp till omkring 200 miljarder operationer per sekund, allt utan att ta till ytterligare elektronisk tidshårdvara.

Smartare ljuskretsar för tung matematik

I hjärtat av beräkningsblocket finns ett rutnät av små ringformade optiska resonatorer som styr hur starkt varje ljuskanal bidrar till slutresultatet—analogt med de justerbara vikterna i ett neuralt nätverk. Författarna använder en särskild dubbelsringdesign på en flerskikts fotonisk plattform som gör dessa element mindre känsliga för temperaturförändringar och tillverkningsimperfektioner, samtidigt som den erbjuder ett brett, platt optiskt svar. Det betyder att ringarna kan hantera högfrekventa signaler med mindre distorsion och bibehålla precisa viktinställningar—bättre än 7 bitars effektiv precision—med hjälp av enkel kalibrering. I tester utförde chippet framgångsrikt fyrkanaliga matrismultiplikationer vid symbolhastigheter upp till 30 gigabaud, vilket demonstrerar både hastighet och noggrannhet.

Figure 2
Figure 2.

Praktiskt test med 3D-lasermätning

För att visa att deras motor är användbar utöver laboratoriemått tillämpade teamet den på ett praktiskt 3D-igenkänningsproblem: att skilja gående från fordon i LiDAR-punktskumdata. De använde ett kompakt 3D-neuralt nät liknande kända realtidsmodeller, tränade dess parametrar digitalt och lastade sedan över den avgörande 3D-konvolutionssteget till den fotoniska motorn. Vid en symbolhastighet på 20 gigabaud producerade det optiska systemet feature-kartor som stämde väl överens med digitala beräkningar och uppnådde en klassificeringsnoggrannhet på cirka 97 procent—i praktiken samma som en traditionell dator, men med den tunga 3D-matematiken utförd i ljus.

Vad detta betyder för vardagstekniken

Enkelt uttryckt visar arbetet att det är möjligt att bygga en kompakt optisk ”mattemotor” som direkt tar sig an den svåraste delen av 3D-AI-arbetslaster, samtidigt som den använder mindre minne, färre elektroniska komponenter och potentiellt mycket mindre energi än nuvarande konstruktioner. Genom att hålla datacaching, tidsjustering och beräkning i det optiska domänet minskar tillvägagångssättet komplexiteten och öppnar en väg mot högre hastigheter och större parallellism. När fotonisk integration förbättras och integrerade ljuskällor och förstärkare mognar kan sådana 3D-tensormotorer bli nyckelbyggstenar i framtida enheter för självkörning, medicinsk avbildning, videoanalys och uppslukande virtuella miljöer—tyst användande av ljusstrålar för att hjälpa maskiner se och förstå vår tredimensionella värld i realtid.

Citering: Wu, Y., Ni, Z., Li, X. et al. Integrated photonic 3D tensor processing engine. Light Sci Appl 15, 154 (2026). https://doi.org/10.1038/s41377-026-02183-y

Nyckelord: fotonisk beräkning, 3D-neurala nätverk, optiska acceleratorer, LiDAR-igenkänning, tensorbearbetning