Clear Sky Science · de

Femtojoule-Schwelle rekonfigurierbare all-optische nichtlineare Aktivatoren für pikosekundengetaktete optische neuronale Netze

· Zurück zur Übersicht

Warum winzige Lichtstöße künftige KI antreiben könnten

Die heutige künstliche Intelligenz läuft auf großen Farmen stromhungriger elektronischer Chips. Mit der Forderung nach intelligenteren Telefonen, Autos und Rechenzentren werden Stromverbrauch und Abwärme zu ernsthaften Engpässen. Diese Arbeit beschreibt einen Weg, einen Teil dieser Rechenarbeit mit Licht statt Elektronen zu erledigen, mithilfe winziger optischer Bauelemente, die wie die „Aktivierungs“-Schalter in einem neuronalen Netz funktionieren. Diese Schalter arbeiten mit extrem geringen Lichtenergien und in enorm hoher Geschwindigkeit und bieten einen Ausblick auf ultraflache, energieeffiziente KI‑Hardware.

Von langsamer, heißer Elektronik zu schneller, kühler Photonik

Konventionelle Computerchips bewegen elektrische Ladungen durch Metallleitungen und Transistoren. Dieser Ansatz hat uns lange gute Dienste geleistet, stößt aber zunehmend an Grenzen bezüglich Geschwindigkeit und Energieeffizienz. Optische neuronale Netze ersetzen bewegte Ladungen durch Photonen, die in Wellenleitern reisen — im Wesentlichen winzige Lichtpfade auf dem Chip. Licht kann Informationen schnell, in vielen Farben gleichzeitig und mit wenig Erwärmung übertragen. Um ein praktisches rein optisches neuronales Netz zu bauen, braucht man jedoch eine Schlüsselkomponente: ein kompaktes Bauelement, das ein Lichtsignal empfängt und auf nichtlineare Weise transformiert, so wie ein Neuron erst feuert, wenn der Eingang einen Schwellenwert übersteigt. Bislang waren solche rein optischen „Aktivatoren“ meist zu groß, zu langsam oder zu energiehungrig.

Figure 1
Figure 1.

Eine mikroskopische Lichtfalle, die Signale zu biegen lernt

Die Autoren entwickeln zunächst eine Silizium‑photonische Kristallkavität — eine perforierte Siliziumplatte, die Licht bei bestimmten Farben einfängt und verlangsamt. Durch sorgfältiges Anordnen einer Lochreihe erzeugen sie eine winzige Region, in der sich ein kurzer Lichtpuls resonant aufbauen und seine Intensität steigern kann. Das verstärkt eine subtile Eigenschaft von Silizium, den Kerr‑Effekt, bei dem sich der Brechungsindex des Materials leicht ändert, wenn die im Inneren befindliche Lichtintensität zunimmt. Diese kleine Änderung verschiebt die Resonanzfarbe der Kavität und verändert so, wieviel eines durchlaufenden Lichtpulses übertragen wird. Durch Wahl der Eingangs­wellenlänge relativ zur Resonanzspitze kann das Gerät verschiedene Aktivierungs­kurven nachbilden, die in der maschinellen Intelligenz verwendet werden, einschließlich linearer, ReLU‑ähnlicher (rectified linear) und sigmoid‑ähnlicher Antworten. Selbst in dieser reinen Siliziumversion ist der Aktivator nur etwa 15 Mikrometer × 10 Mikrometer groß — kleiner als ein Staubkorn — und reagiert in unter 2 Billionsteln einer Sekunde.

Graphen erzielen ultrasparsame Schaltenergien

Um die Aktivierungsschwelle noch weiter zu senken, integrieren die Forschenden eine einzelne Atomlage Graphen auf der Siliziumkavität. Graphen absorbiert Licht natürlicherweise, bei hoher Intensität sättigt diese Absorption jedoch: Sobald viele Elektronen angeregt sind, können zusätzliche Photonen leichter durchgehen. Durch die Kombination dieser „sättigbaren Absorption“ mit der slow‑light‑Verstärkung der Kavität erreicht das Bauelement eine Sättigungsenergie von nur 4 Femtojoule — ungefähr die Energie weniger zigtausend Telekom‑Photonen — und eine Ansprechzeit von etwa 1 Pikosekunde. In benachbarten Wellenlängenbereichen kann dieselbe Struktur weiterhin den Kerr‑Effekt von Silizium nutzen, um die Aktivierungsfunktion bei Bedarf umzuformen und zwischen sigmoid‑ähnlichem, ReLU‑ähnlichem und nahezu linearem Verhalten mit Schwellenwerten bis hinunter zu 30 Femtojoule zu wechseln. In Bezug auf Geschwindigkeit und benötigte Energie übertrifft diese Kennzahl frühere On‑Chip‑optische Aktivatoren um mehrere Größenordnungen.

Figure 2
Figure 2.

Ein gepulstes optisches Gehirn auf einem Chip aufbauen

Mit diesen Aktivatoren als Bausteinen skizzieren die Autoren eine vollständige optische Netzwerkarchitektur, die von ultrakurzen Lichtpulsen statt von kontinuierlichen Strahlen angetrieben wird. Ein Hochfrequenz‑Pulslaser erzeugt eine Folge von Pikosekunden‑Spikes, die mithilfe schnell schaltender Modulatoren mit Daten kodiert und dann über viele Wellenlängen verteilt werden. Auf dem Chip leiten spezialisierte Wellenlängen‑Teilungskomponenten diese Farben und gewichten sie mit nichtflüchtigen Phasenwechselmaterialien, die ihre Einstellungen ohne Energieverbrauch speichern. Nach der linearen Gewichtung passieren die Signale die Graphen‑Silizium‑Aktivatoren, die die gewünschte nichtlineare Antwort aufprägen, bevor das Licht zur nächsten Schicht weitergeleitet wird. Simulationen zeigen, dass ein System mit Aktivierungsenergien unter etwa 30 Femtojoule Rechendichten von rund 10^3 Billionen Operationen pro Sekunde pro Quadratmillimeter und Energieeffizienzen nahe 10^6 Billionen Operationen pro Watt pro Quadratmillimeter erreichen könnte — weit jenseits typischer elektronischer Beschleuniger.

Was das für die alltägliche KI bedeutet

Um zu prüfen, ob diese exotischen optischen Aktivationen wie ihre elektronischen Gegenstücke funktionieren, speisen die Forschenden ihre gemessenen Aktivierungs­kurven in Softwaremodelle ein und trainieren diese an Standard‑Klassifikationsaufgaben — von einfachen zweidimensionalen Mustern über handgeschriebene Ziffern (MNIST) bis zu komplexen Farbbildern (CIFAR‑10). Die Graphen‑Silizium‑Aktivatoren erreichen vergleichbare oder bessere Ergebnisse als einfache lineare Antworten, besonders bei schwierigeren Bildaufgaben, bei denen ReLU‑ähnliches Verhalten sich als besonders leistungsfähig erweist. Einfach gesagt zeigt diese Arbeit, dass ein daumennagelgroßer Chip aus sorgfältig strukturiertem Silizium und Graphen eines Tages wichtige Rechenschritte der KI mit winzigen Lichtstößen statt mit Elektrizität erledigen könnte. Wenn solche Systeme skaliert und mit ausgereiften photonischen Technologien integriert werden, könnten rein optische nichtlineare Aktivatoren schnellerere, kältere und effizientere Hardware für kommende KI‑Generationen ermöglichen.

Zitation: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4

Schlüsselwörter: optische neuronale Netze, Graphen-Photonik, photonische Kristallkavitäten, nichtlineare Aktivierung, energieeffiziente KI-Hardware