Clear Sky Science · fr

Activatrices non linéaires optiques reconfigurables à seuil de l’ordre du femtojoule pour réseaux neuronaux optiques à impulsions picosecondes

· Retour à l’index

Pourquoi de petites rafales de lumière pourraient alimenter l’IA de demain

L’intelligence artificielle d’aujourd’hui fonctionne sur d’immenses fermes de puces électroniques gourmandes en énergie. À mesure que nous exigeons des téléphones, des voitures et des centres de données plus intelligents, la consommation électrique et la dissipation thermique deviennent des obstacles majeurs. Cet article présente un moyen de confier une partie de ce travail au lieu d’électrons à la lumière, en utilisant de minuscules dispositifs optiques qui jouent le rôle des commutateurs d’« activation » dans un réseau neuronal. Ces commutateurs fonctionnent avec des énergies lumineuses extrêmement faibles et à des vitesses fulgurantes, offrant un aperçu d’un matériel IA ultrarapide et économe en énergie.

Des électroniques lentes et chaudes à la photonique rapide et froide

Les circuits classiques déplacent des charges électriques par des fils métalliques et des transistors. Cette approche nous a bien servis, mais elle atteint des limites en vitesse et en efficacité énergétique. Les réseaux neuronaux optiques remplacent les charges mobiles par des photons circulant dans des guides d’ondes — essentiellement de minuscules voies lumineuses sur puce. La lumière peut transporter l’information rapidement, en plusieurs longueurs d’onde simultanément, et avec peu de chauffage. Toutefois, la construction d’un réseau neuronal entièrement optique pratique exige un ingrédient clé : un dispositif compact qui reçoit un signal lumineux et en délivre une version transformée de façon non linéaire, tout comme un neurone n’émet qu’au‑delà d’un seuil. Jusqu’à présent, de tels éléments d’« activation » tout‑optiques ont souvent été trop volumineux, trop lents ou trop énergivores.

Figure 1
Figure 1.

Un piège lumineux microscopique qui apprend à plier les signaux

Les auteurs conçoivent d’abord une cavité en cristal photonique sur silicium — une lame perforée de silicium qui piège et ralentit la lumière à des longueurs d’onde spécifiques. En arrangeant soigneusement une rangée de trous, ils créent une région minuscule où une impulsion lumineuse courte peut résonner et accumuler son intensité. Cela renforce une propriété subtile du silicium appelée effet Kerr, où l’indice de réfraction du matériau change légèrement lorsque la lumière à l’intérieur devient intense. Ce léger changement décale la couleur de résonance de la cavité et, par conséquent, modifie la quantité d’une impulsion lumineuse incidente qui la traverse. En choisissant la longueur d’onde d’entrée par rapport au pic de résonance de la cavité, les chercheurs peuvent faire fonctionner le dispositif selon plusieurs courbes d’activation utilisées en apprentissage automatique, y compris des réponses linéaires, de type ReLU (rectified linear) et de type sigmoïde. Même dans cette version purement silicium, l’activatrice mesure seulement environ 15 micromètres sur 10 micromètres — plus petite qu’un grain de poussière — et répond en moins de 2 trillionièmes de seconde.

Ajouter du graphène pour commuter avec une énergie ultra‑faible

Pour abaisser encore le seuil d’activation, l’équipe intègre une couche de graphène d’un atome d’épaisseur au‑dessus de la cavité en silicium. Le graphène absorbe naturellement la lumière, mais à haute intensité son absorption se sature : une fois de nombreux électrons excités, des photons supplémentaires peuvent passer plus facilement. En combinant cette « absorption saturable » avec l’amplification due à la lumière ralentie dans la cavité, le dispositif atteint une énergie de saturation de seulement 4 femtojoules — approximativement l’énergie portée par quelques dizaines de milliers de photons de télécommunications — et un temps de réponse d’environ 1 picoseconde. À des longueurs d’onde proches, la même structure peut toujours exploiter l’effet Kerr du silicium pour reconfigurer sa courbe d’activation à la demande, basculant entre des comportements de type sigmoïde, ReLU et presque linéaire avec des seuils aussi bas que 30 femtojoules. En termes de vitesse et d’énergie requise, cette figure de mérite surpasse de plusieurs ordres de grandeur les activateurs optiques sur puce précédents.

Figure 2
Figure 2.

Construire un cerveau optique à impulsions sur une puce

En utilisant ces activateurs comme blocs de base, les auteurs décrivent une architecture complète de réseau neuronal optique pilotée par des impulsions lumineuses ultrarapides plutôt que par des faisceaux continus. Un laser pulsé à haute fréquence de répétition génère une suite d’impulsions picosecondes, codées en données par des modulateurs haute vitesse puis réparties sur de nombreuses longueurs d’onde. Sur la puce, des composants spécialisés en multiplexage en longueur d’onde dirigent et pondèrent ces couleurs à l’aide de matériaux à changement de phase non volatils qui conservent leurs réglages sans consommer d’énergie. Après pondération linéaire, les signaux traversent les activateurs silicium‑graphène, qui impriment la réponse non linéaire souhaitée avant que la lumière ne soit routée vers la couche suivante. Des simulations montrent qu’avec des énergies d’activation inférieures à environ 30 femtojoules, un tel système pourrait atteindre des densités de calcul de l’ordre de 10³ billions d’opérations par seconde et par millimètre carré et des efficacités énergétiques proches de 10⁶ billions d’opérations par watt et par millimètre carré — bien au‑delà des accélérateurs électroniques typiques.

Ce que cela signifie pour l’IA du quotidien

Pour vérifier si ces activations optiques exotiques se comportent comme leurs homologues électroniques, l’équipe intègre ses courbes d’activation mesurées dans des modèles logiciels et les entraîne sur des tâches de classification standard, depuis des motifs bidimensionnels simples jusqu’à des chiffres manuscrits (MNIST) et des images couleur complexes (CIFAR‑10). Les activateurs silicium‑graphène égalent ou surpassent des réponses linéaires simples, en particulier sur les tâches d’image plus difficiles, où le comportement de type ReLU se révèle particulièrement efficace. En termes clairs, ce travail montre qu’une puce de la taille d’un ongle, faite de silicium et de graphène soigneusement structurés, pourrait un jour prendre en charge des étapes clés des calculs d’IA en utilisant de petites rafales de lumière plutôt que de l’électricité. Si l’on parvient à monter en échelle et à intégrer ces composants aux technologies photoniques matures, de tels activateurs non linéaires totalement optiques pourraient contribuer à offrir un matériel d’IA plus rapide, plus frais et plus efficace pour les prochaines générations.

Citation: Liu, R., Wang, Z., Zhong, C. et al. Femto-joule threshold reconfigurable all-optical nonlinear activators for picosecond pulsed optical neural networks. Light Sci Appl 15, 128 (2026). https://doi.org/10.1038/s41377-025-02175-4

Mots-clés: réseaux neuronaux optiques, photonique au graphène, cavités en cristal photonique, activation non linéaire, matériel IA économe en énergie