Clear Sky Science · pl
Przełączalne nieulotne nieliniowe aktywatory całkowicie optyczne o progu w femtodżulach dla pikosekundowych pulsujących optycznych sieci neuronowych
Dlaczego maleńkie wybuchy światła mogą zasilać przyszłe AI
Dzisiejsza sztuczna inteligencja działa na ogromnych farmach energochłonnych układów elektronicznych. W miarę jak wymagamy inteligentniejszych telefonów, samochodów i centrów danych, zużycie prądu i odprowadzanie ciepła stają się poważnymi przeszkodami. W artykule przedstawiono sposób, by część tych obciążeń przenieść z elektronów na światło, korzystając z maleńkich urządzeń optycznych pełniących rolę „funkcji aktywacji” w sieci neuronowej. Te przełączniki działają przy niezwykle małych energiach świetlnych i z piorunującą szybkością, dając wgląd w ultraszybki, energooszczędny sprzęt AI.
Od wolnej, gorącej elektroniki do szybkiej, chłodnej fotoniki
Konwencjonalne układy scalone transportują ładunki elektryczne przez metalowe ścieżki i tranzystory. To podejście dobrze nam służyło, ale osiąga granice pod względem szybkości i efektywności energetycznej. Optyczne sieci neuronowe zastępują przemieszczające się ładunki fotonami podróżującymi w światłowodach na chipie — w istocie małych kablach optycznych. Światło może szybko przenosić informacje, w wielu kolorach jednocześnie i przy minimalnym nagrzewaniu. Jednak zbudowanie praktycznej, całkowicie optycznej sieci neuronowej wymaga kluczowego składnika: kompaktowego urządzenia, które przyjmie sygnał świetlny i nieliniowo go przekształci, podobnie jak neuron „strzela” tylko gdy wejście przekroczy próg. Do tej pory takie wszystkie optyczne elementy aktywujące były zbyt duże, zbyt wolne lub zbyt energochłonne.

Mikroskopijna pułapka na światło, która uczy się wyginać sygnały
Autorzy najpierw projektują krystaliczną szczelinę fotoniczną w krzemie — perforowaną płytkę krzemu, która chwyta i spowalnia światło przy określonych długościach fali. Poprzez staranne ułożenie rzędu otworów tworzą maleńki obszar, w którym krótki impuls świetlny może rezonować, zwiększając swoją intensywność. To wzmacnia subtelną właściwość krzemu zwaną efektem Kerra, gdy indeks załamania materiału zmienia się nieznacznie przy dużej intensywności światła. Ta drobna zmiana przesuwa rezonans komory i w rezultacie zmienia, ile z przechodzącego impulsu świetlnego przepuszczane jest dalej. Dobierając długość fali wejściowej względem szczytu rezonansu komory, badacze mogą sprawić, że urządzenie zachowuje się jak różne krzywe aktywacji stosowane w uczeniu maszynowym, w tym liniowe, przypominające ReLU (prostowanie liniowe) oraz przypominające sigmoidę. Nawet w tej czysto krzemowej wersji aktywator ma zaledwie około 15 mikrometrów na 10 mikrometrów — mniejszy niż ziarnko kurzu — i reaguje w czasie poniżej 2 bilionowych części sekundy.
Dodanie grafenu dla ultrasłaboprądowego przełączania
Aby jeszcze obniżyć próg aktywacji, zespół integruje jednowarstwową powłokę grafenu na wierzchu krzemowej komory. Grafen naturalnie absorbuje światło, ale przy wysokich natężeniach absorpcja ta się nasyca: gdy wiele elektronów jest wzbudzonych, kolejne fotony przechodzą łatwiej. Łącząc tę «nasycalną absorpcję» ze wzmocnieniem spowolnionego światła w komorze, urządzenie osiąga energię nasycenia zaledwie 4 femtodżule — mniej więcej energię przenoszoną przez kilka dziesiątek tysięcy fotonów telekomunikacyjnych — i czas odpowiedzi około 1 pikosekundy. W pobliskich długościach fali ta sama struktura nadal może wykorzystywać efekt Kerra krzemu do kształtowania krzywej aktywacji na żądanie, przełączając między zachowaniem podobnym do sigmoidy, ReLU i niemal liniowym przy progach tak niskich jak 30 femtodżuli. Pod względem szybkości i wymaganego nakładu energii ten wskaźnik przewyższa wcześniejsze aktywatory optyczne na chipie o kilka rzędów wielkości.

Budowanie pulsującego optycznego mózgu na chipie
Wykorzystując te aktywatory jako elementy składowe, autorzy przedstawiają pełną architekturę optycznej sieci neuronowej napędzanej ultrszybkimi impulsami świetlnymi zamiast ciągłych wiązek. Laser impulsowy o wysokiej częstotliwości generuje serię pikosekundowych skoków, które są kodowane danymi przez szybkie modulatori, a następnie rozdzielane na wiele długości fali. Na chipie wyspecjalizowane komponenty do mnożenia długości fali kierują i ważą te kolory za pomocą nieulotnych materiałów fazowo‑zmiennych, które pamiętają ustawienia bez zużywania energii. Po liniowym ważeniu sygnały przechodzą przez grafen‑krzemowe aktywatory, które nadają pożądaną odpowiedź nieliniową, zanim światło zostanie skierowane do następnej warstwy. Symulacje pokazują, że przy energiach aktywacji poniżej około 30 femtodżuli taki system mógłby osiągnąć gęstości obliczeniowe rzędu 10³ bilionów operacji na sekundę na milimetr kwadratowy oraz efektywności energetyczne bliskie 10⁶ bilionów operacji na wat na milimetr kwadratowy — znacznie poza zasięgiem typowych akceleratorów elektronicznych.
Co to oznacza dla codziennego AI
Aby sprawdzić, czy te egzotyczne optyczne aktywacje zachowują się jak ich elektroniczne odpowiedniki, zespół wprowadza zmierzone krzywe aktywacji do modeli programowych i trenuje je do standardowych zadań klasyfikacyjnych, od prostych wzorców dwuwymiarowych po odręczne cyfry (MNIST) i złożone obrazy kolorowe (CIFAR‑10). Grafen‑krzemowe aktywatory dorównują lub przewyższają proste odpowiedzi liniowe, szczególnie w trudniejszych zadaniach obrazowych, gdzie zachowanie podobne do ReLU okazuje się szczególnie efektywne. Mówiąc wprost, praca pokazuje, że miniaturowy układ z precyzyjnie ukształtowanego krzemu i grafenu mógłby pewnego dnia wykonać kluczowe etapy obliczeń AI, używając maleńkich wybuchów światła zamiast elektryczności. Jeśli zostanie odpowiednio skalowany i zintegrowany z dojrzałymi technologiami fotonicznymi, takie całkowicie optyczne nieliniowe aktywatory mogłyby przyczynić się do szybszego, chłodniejszego i bardziej wydajnego sprzętu dla kolejnych generacji sztucznej inteligencji.
Cytowanie: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4
Słowa kluczowe: optyczne sieci neuronowe, grafenowe fotonika, pola rezonansowe w kryształach fotonicznych, nieliniowa aktywacja, energooszczędny sprzęt AI