Clear Sky Science · fr

Réseaux neuronaux profonds diffractifs anti‑interférences pour la reconnaissance multi‑objets

· Retour à l’index

Percevoir le signal dans un monde bruyant

La vie moderne est remplie de caméras et de capteurs qui doivent extraire les éléments importants d’une scène – un piéton sur la chaussée, une minuscule tumeur dans un examen, un objet suspect dans une foule – même lorsqu’ils sont entourés d’encombrement. Cet article présente un nouveau type de réseau neuronal « tout‑optique » qui réalise une grande partie de cette reconnaissance avec la lumière elle‑même, au lieu de puces électroniques. Le résultat est un système capable de reconnaître des objets choisis dans des scènes animées et chargées tout en traitant le reste comme un bruit de fond inoffensif, ce qui pourrait permettre une vision plus rapide et beaucoup plus économe en énergie pour les machines du futur.

Figure 1
Figure 1.

Pourquoi les ordinateurs faits de lumière comptent

Les systèmes d’apprentissage profond conventionnels fonctionnent sur des processeurs électroniques qui déplacent des courants à travers des milliards de commutateurs microscopiques. Ils sont puissants mais aussi lents quand il faut prendre des décisions en microsecondes, et ils gaspillent beaucoup d’énergie sous forme de chaleur. La lumière offre une alternative séduisante : les faisceaux peuvent transporter d’énormes quantités d’information en parallèle, voyager à la vitesse limite et ne chauffent pas les circuits comme le font les courants électriques. Les réseaux neuronaux optiques exploitent ces avantages en façonnant la lumière avec des surfaces conçues de manière précise afin qu’un faisceau les traversant « calcule » effectivement la réponse à un problème de reconnaissance.

Du simple objet aux scènes encombrées

La plupart des réseaux neuronaux optiques existants sont limités à des tâches simples, comme déterminer quel chiffre unique est imprimé au centre d’une image propre. Ils peinent lorsque plusieurs objets apparaissent ensemble, se chevauchent ou bougent – exactement les conditions rencontrées dans les scènes du monde réel. Les tentatives antérieures pour gérer plusieurs objets exigeaient souvent des règles strictes sur la position des objets ou s’appuyaient sur un traitement électronique supplémentaire après l’étage optique, ce qui réduisait les gains en vitesse et en consommation d’énergie de l’approche optique.

Apprendre à la lumière à ignorer les distractions

Les auteurs présentent un « réseau neuronal profond diffractif anti‑interférences », ou AI D2NN, qui s’attaque directement aux scènes encombrées. Il se compose de seulement deux couches ultra‑minces à motifs — des métasurfaces — que traverse un faisceau de lumière térahertz. Ces couches sont conçues par entraînement informatique de sorte que la lumière provenant des objets cibles, ici les chiffres manuscrits 0 à 5, soit dirigée vers l’un des six petits points lumineux sur le plan de sortie, un point par chiffre. En parallèle, la lumière provenant de tout le reste — autres chiffres, images de vêtements, lettres et combinaisons aléatoires — est délibérément brouillée en une brume faible et presque uniforme qui n’active aucun point de sortie.

Figure 2
Figure 2.

Construire et tester un ordinateur optique physique

Pour transformer le design entraîné en matériel, l’équipe a fabriqué des métasurfaces en silicium composées de minuscules piliers cylindriques qui retardent la lumière qui les traverse de quantités précises. Disposés en grille de 100 par 100, ces piliers agissent comme des neurones optiques dont l’effet combiné réalise le réseau appris. Les chercheurs ont testé le système avec des faisceaux térahertz modulés pour afficher des mélanges de chiffres cibles et 40 types différents de formes interférentes, placées à des positions et tailles aléatoires pour imiter des scènes en mouvement et encombrées. Dans des simulations informatiques, le réseau optique a correctement reconnu les chiffres choisis dans environ 87 % de ces cas difficiles, et une configuration expérimentale réelle a atteint presque la même précision, démontrant que le concept fonctionne en dehors d’un modèle informatique.

Ce que cela signifie pour les machines de demain

En termes simples, ce travail montre qu’il est possible de construire un dispositif optique d’une épaisseur de papier qui voit à travers l’encombrement et détecte quand même l’objet qui l’intéresse, en utilisant très peu d’énergie et en opérant à la vitesse de la lumière. Parce que le design repose sur des propriétés générales de la diffraction, la même idée pourrait être adaptée à d’autres couleurs ou longueurs d’onde et combinée avec d’autres astuces optiques pour traiter beaucoup plus de classes d’objets simultanément. Avec des améliorations supplémentaires, des réseaux optiques anti‑interférences similaires pourraient aider les véhicules autonomes à identifier rapidement les usagers de la route importants, assister les médecins en signalant en temps réel des caractéristiques suspectes dans des examens, ou équiper des caméras de sécurité légères capables de détecter des menaces sans traitement électronique lourd.

Citation: Huang, Z., Liu, Y., Zhang, N. et al. Anti-interference diffractive deep neural networks for multi-object recognition. Light Sci Appl 15, 101 (2026). https://doi.org/10.1038/s41377-026-02188-7

Mots-clés: réseaux neuronaux optiques, reconnaissance multi‑objets, métasurfaces, imagerie térahertz, calcul tout‑optique