Clear Sky Science · de

Integrierte photonische 3D-Tensor-Verarbeitungseinheit

· Zurück zur Übersicht

Warum schnellere Denkmaschinen wichtig sind

Von selbstfahrenden Autos über medizinische Scanner bis hin zur virtuellen Realität verlässt sich unsere Welt zunehmend auf Computer, die komplexe, dreidimensionale Daten in Echtzeit verstehen können. Die heutigen Systeme der künstlichen Intelligenz sind leistungsfähig, doch die elektronischen Chips, die sie antreiben, kommen durch den Bedarf an immer größeren und schnelleren neuronalen Netzen an ihre Grenzen. Dieses Papier stellt eine neue Methode vor, solche 3D-Daten mit Licht statt mit Elektrizität zu verarbeiten, was schnellere, effizientere „Denkmaschinen“ verspricht, die langfristig Autos sicherer, Diagnosen schneller und Online-Erlebnisse intensiver machen könnten.

Von flachen Bildern zu 3D-Welten

Viele vertraute KI-Systeme arbeiten mit flachen Bildern — zweidimensionalen Pixelgittern — und nutzen sogenannte konvolutionale neuronale Netze. Moderne Sensoren, etwa medizinische Scanner und laserbasierte LiDAR-Systeme in autonomen Fahrzeugen, erfassen jedoch vollständige 3D-Szenen über die Zeit. Diese reichhaltigeren Datensätze lassen sich naturgemäß als „Tensoren“ beschreiben, also als mehrdimensionale Arrays. Ihre Verarbeitung mit 3D-Neuronalen Netzen ist extrem leistungsfähig, aber auch sehr fordernd: Der Rechen- und Speicheraufwand wächst rapide mit jeder zusätzlichen Dimension. Konventionelle elektronische Beschleuniger wie GPUs und TPUs sind größtenteils auf flache, zweidimensionale Matrixoperationen ausgelegt, weshalb sie 3D-Daten ständig umformen und verschieben müssen, was Zeit, Energie und Speicher verschwendet.

Figure 1
Figure 1.

Das Licht die schwere Arbeit machen lassen

Die Forschenden stellen eine integrierte photonische 3D-Tensor-Verarbeitungseinheit vor, die einen entscheidenden Schritt von 3D-Neuronalen Netzen direkt mit Licht ausführt. Anstatt Daten wiederholt zwischen Speicher und elektronischen Prozessoren zu bewegen, sendet ihr System Informationen als optische Signale, die durch winzige Wellenleiter und Resonatoren auf einem Chip laufen. Drei unterschiedliche „Achsen“ werden genutzt, um Daten gleichzeitig zu kodieren und zu verarbeiten: die Farbe (Wellenlänge) des Lichts, der Zeitpunkt, zu dem Pulse passieren, und die physischen Pfade, die sie über den Chip nehmen. Durch das Ineinanderfügen dieser drei Dimensionen kann das System vollständige 3D-Faltungsoperationen verarbeiten, ohne sie in viele kleinere Aufgaben zu zerlegen oder auf sperrige elektronische Steuerhardware angewiesen zu sein.

Eingebauter optischer Speicher und Synchronisation

Eine zentrale Herausforderung in der Hochgeschwindigkeitsrechnung ist, viele Datenkanäle zeitlich präzise auszurichten. Traditionelle Systeme verwenden komplexe elektronische Taktkreise und große Speicherpuffer dafür. Das Team löst das Problem vollständig im optischen Bereich. Sie fügen zwei optische Speichereinheiten aus einstellbaren Verzögerungsleitungen vor und nach dem Hauptrechenblock hinzu. Diese Verzögerungsleitungen wirken wie einstellbare Wartebereiche für Lichtpulse und erlauben dem System, Daten zu „cachen“ und Kanäle zu synchronisieren, indem einfach die Laufzeit jedes Pulses auf dem Chip verändert wird. Die Verzögerungen lassen sich mit Pikosekunden- (Billionstel Sekunden) Präzision fein einstellen und unterstützen effektive Taktfrequenzen von bis zu etwa 200 Milliarden Operationen pro Sekunde — ganz ohne zusätzliche elektronische Timing-Hardware.

Intelligentere Lichtschaltungen für schwere Mathematik

Im Zentrum des Rechenblocks befindet sich ein Gitter winziger ringförmiger optischer Resonatoren, die steuern, wie stark jeder Lichtkanal zum Endergebnis beiträgt — analog zu den einstellbaren Gewichten in einem neuronalen Netz. Die Autorinnen und Autoren verwenden ein spezielles Zwei-Ring-Design auf einer mehrschichtigen photonischen Plattform, das diese Elemente weniger empfindlich gegenüber Temperaturänderungen und Fertigungsfehlern macht und gleichzeitig eine breite, flache optische Antwort bietet. Das bedeutet, die Ringe können Hochgeschwindigkeitssignale mit weniger Verzerrung verarbeiten und präzise Gewichtseinstellungen beibehalten — besser als 7 Bit effektive Präzision — unter Verwendung einfacher Kalibrierung. In Tests führte der Chip erfolgreich Vier-Kanal-Matrixmultiplikationen bei Symbolraten von bis zu 30 Gigabaud aus und demonstrierte sowohl Geschwindigkeit als auch Genauigkeit.

Figure 2
Figure 2.

Praxisprüfung mit 3D-Lasersensorik

Um zu zeigen, dass ihre Einheit über Laborbenchmarks hinaus nützlich ist, wandte das Team sie auf ein praktisches 3D-Erkennungsproblem an: die Unterscheidung von Fußgängern und Fahrzeugen in LiDAR-Punktwolken. Sie nutzten ein kompaktes 3D-Neuronales Netz, ähnlich bekannten Echtzeitmodellen, trainierten dessen Parameter digital und verlagerten dann den entscheidenden 3D-Faltungsschritt auf die photonische Einheit. Bei einer Symbolrate von 20 Gigabaud erzeugte das optische System Merkmalskarten, die den digitalen Berechnungen sehr nahekamen, und erreichte eine Klassifizierungsgenauigkeit von etwa 97 Prozent — im Wesentlichen gleichauf mit einem traditionellen Computer, wobei die schwere 3D-Mathematik im Licht ausgeführt wurde.

Was das für Alltags­technologie bedeutet

Einfach gesagt zeigt diese Arbeit, dass es möglich ist, eine kompakte optische „Mathe‑Einheit“ zu bauen, die direkt den anspruchsvollsten Teil von 3D-KI-Arbeitslasten angeht und dabei weniger Speicher, weniger elektronische Bauteile und potenziell deutlich weniger Energie als heutige Designs benötigt. Indem Daten-Caching, Zeitabstimmung und Berechnung vollständig im optischen Bereich bleiben, reduziert der Ansatz die Komplexität und eröffnet Wege zu höheren Geschwindigkeiten und größerer Parallelität. Mit fortschreitender photonischer Integration und der Reifung von On‑Chip-Lichtquellen und Verstärkern könnten solche 3D-Tensor‑Engines zu wichtigen Bausteinen künftiger Geräte für autonomes Fahren, medizinische Bildgebung, Videoanalyse und immersive virtuelle Umgebungen werden — still und leise Strahlen von Licht nutzend, damit Maschinen unsere 3D‑Welt in Echtzeit sehen und verstehen können.

Zitation: Wu, Y., Ni, Z., Li, X. et al. Integrated photonic 3D tensor processing engine. Light Sci Appl 15, 154 (2026). https://doi.org/10.1038/s41377-026-02183-y

Schlüsselwörter: photonisches Rechnen, 3D-Neuronale Netze, optische Beschleuniger, LiDAR-Erkennung, Tensorverarbeitung