Clear Sky Science · sv

Antistörnings diffraktiva djupa neurala nätverk för igenkänning av flera objekt

· Tillbaka till index

Se signalen i en bullrig värld

Det moderna livet är fullt av kameror och sensorer som måste urskilja det viktiga i en scen – en fotgängare på vägen, en liten tumör i en skanning, ett misstänkt föremål i en folkmassa – även när de omges av röriga bakgrunder. Denna artikel presenterar en ny typ av ”all‑optiskt” neuralt nätverk som utför stora delar av denna igenkänning med själva ljuset i stället för elektroniska kretsar. Resultatet är ett system som kan känna igen valda objekt i upptagna, förskjutna scener samtidigt som allt annat behandlas som ofarligt bakgrundsbrus, vilket potentiellt möjliggör snabbare och mycket energieffektivare syn för framtida maskiner.

Figure 1
Figure 1.

Varför ljusburna datorer spelar roll

Konventionella djupinlärningssystem körs på elektroniska processorer som förflyttar strömmar genom miljarder små brytare. De är kraftfulla men också långsamma när beslut måste fattas på mikrosekunder, och de slösar mycket energi som värme. Ljus erbjuder ett lockande alternativ: strålar kan bära enorma mängder information parallellt, färdas vid den ultimata hastighetsgränsen och värmer inte upp kretsar på samma sätt som elektriska strömmar. Optiska neurala nätverk utnyttjar dessa fördelar genom att forma ljuset med noggrant designade ytor så att en stråle som passerar genom dem i praktiken ”beräknar” svaret på ett igenkänningsproblem.

Från ett objekt till trånga scener

De flesta befintliga optiska neurala nätverk är begränsade till enkla uppgifter, som att avgöra vilken enstaka siffra som är tryckt i mitten av en ren bild. De har svårt när flera objekt förekommer samtidigt, överlappar eller rör sig – exakt de förhållanden som finns i verkliga scener. Tidigare försök att hantera flera objekt krävde ofta strikta regler om var varje objekt kunde förekomma eller förlitade sig på extra elektronisk bearbetning efter den ljusburna etappen, vilket undergrävde hastighets- och energieffektivitetfördelarna med den optiska metoden.

Lära ljuset att ignorera distraktioner

Författarna introducerar ett ”antistörnings diffraktivt djupt neuralt nätverk”, eller AI D2NN, som direkt tar itu med upptagna scener. Det består av endast två ultratunna mönstrade lager – metaytor – som en terahertzljusstråle passerar genom. Dessa lager utformas genom datorträning så att ljus från målobjekten, här handskrivna siffror 0 till 5, styrs in i en av sex små ljusa fläckar i utgångsplanet, en fläck per siffra. Samtidigt skruvas ljuset från allt annat – andra siffror, klädesbilder, bokstäver och slumpmässiga kombinationer av dem – avsiktligt ihop till ett svagt, nästan uniformt dis som inte triggar någon utgångsfläck.

Figure 2
Figure 2.

Bygga och testa en fysisk ljusdator

För att omvandla den tränade designen till hårdvara tillverkade teamet kiselmetaytor bestående av små cylindriska pelare som fördröjer det passerande ljuset med precisa mängder. Arrangerade i ett 100 gånger 100 rutnät fungerar dessa pelare som optiska neuroner vars samlade effekt realiserar det inlärda nätverket. Forskarna testade systemet med terahertzstrålar mönstrade för att visa blandningar av mål-siffror och 40 olika typer av störande former, placerade på slumpmässiga positioner och i varierande storlekar för att efterlikna rörliga, röriga scener. I datorsimuleringar kände det optiska nätverket igen de valda siffrorna korrekt i cirka 87 procent av dessa utmanande fall, och en verklig experimentell uppställning uppnådde nästan samma noggrannhet, vilket visar att konceptet fungerar utanför en datorbild.

Vad detta betyder för framtida maskiner

Enkelt uttryckt visar arbetet att det är möjligt att bygga en pappers‑tunn optisk enhet som ser igenom röran och ändå hittar det objekt den är intresserad av, med mycket låg energiförbrukning och i ljusets hastighet. Eftersom designen bygger på allmänna diffraktionsegenskaper kan samma idé skalas till olika färger eller våglängder av ljus och kombineras med andra optiska knep för att hantera många fler objektklasser samtidigt. Med fortsatt förfining skulle liknande antistörnings optiska nätverk kunna hjälpa självkörande bilar att snabbt identifiera viktiga trafikanter, assistera läkare att flagga misstänkta områden i skanningar i realtid, eller stödja lätta övervakningskameror som upptäcker hot utan tung elektronisk bearbetning.

Citering: Huang, Z., Liu, Y., Zhang, N. et al. Anti-interference diffractive deep neural networks for multi-object recognition. Light Sci Appl 15, 101 (2026). https://doi.org/10.1038/s41377-026-02188-7

Nyckelord: optiska neurala nätverk, igenkänning av flera objekt, metaytor, terahertzavbildning, all-optisk beräkning