Clear Sky Science · fr

Cadre d’apprentissage par renforcement multimodal et multi-agent pour la prédiction du flux de trafic urbain et l’optimisation du contrôle des feux

2026-02-06 · Retour à l’index

Pourquoi des feux plus intelligents comptent

Toute personne qui a subi une série de feux rouges ou progressé au pas dans une rue du centre encombrée sait combien la circulation en ville peut être inefficace. Au-delà de la frustration, les voitures qui tournent au ralenti gaspillent du carburant et émettent des gaz à effet de serre et des polluants dans l’air. Cet article présente une nouvelle façon de gérer le trafic urbain qui considère les feux comme un réseau coordonné et apprenant plutôt que comme des minuteries fixes, avec pour objectif de déplacer les personnes plus rapidement tout en réduisant les embouteillages et les émissions.

Une ville qui perçoit et comprend son trafic

Les chercheurs proposent un système appelé MM-STMAP qui donne à la ville une sorte de système nerveux numérique. Plutôt que de s’appuyer uniquement sur de simples comptages de véhicules, il intègre simultanément de nombreux types de données : flux de trafic, vitesses, conditions météorologiques comme la pluie ou le brouillard, et jours particuliers comme les jours fériés. Ces signaux divers sont nettoyés, combinés et transformés en une description unifiée de ce qui se passe sur les routes. En reconnaissant, par exemple, qu’une heure de pointe pluvieuse et fériée se comporte différemment d’un jour de semaine ordinaire, le système peut mieux anticiper l’évolution du trafic dans les minutes qui suivent.

Voir les motifs dans l’espace et le temps

Les problèmes de circulation ne se cantonnent rarement à un seul carrefour ; ils se propagent à travers tout un réseau de routes. MM-STMAP capture cela en représentant les routes et intersections de la ville comme un réseau de points connectés, puis en apprenant comment les conditions se diffusent sur ce réseau au fil du temps. Il utilise des calculs en couches qui examinent d’abord comment les rues voisines s’influencent mutuellement, puis comment ces influences évoluent d’un pas de temps à l’autre. Un mécanisme d’« attention » spécialement conçu permet au modèle de concentrer sa capacité de calcul sur les périodes historiques les plus pertinentes — comme l’heure de pointe d’hier à la même heure — sans être submergé quand le volume de données augmente. Cela rend pratique le traitement de flux de capteurs de longue durée provenant de grands réseaux urbains.

Des feux qui apprennent ensemble

Au sommet de ce moteur prédictif, les auteurs construisent un système de contrôle basé sur l’apprentissage pour les feux de circulation. Chaque intersection est traitée comme un agent intelligent qui peut choisir combien de temps maintenir le vert ou le rouge dans différentes directions. Ces agents ne fonctionnent pas isolément : ils partagent des informations sur la situation de trafic plus large et sont entraînés ensemble de sorte que leurs décisions individuelles favorisent une circulation fluide à l’échelle du réseau. Le processus d’apprentissage récompense les schémas qui augmentent le nombre de véhicules traversant, réduisent les temps d’attente moyens et limitent le comportement stop-and-go qui gaspille du carburant, tout en pénalisant les configurations qui créent de longues files et des retards.

Mettre le système à l’épreuve

Pour vérifier si MM-STMAP apporte de réels bénéfices, l’équipe l’a testé sur de grands jeux de données réels de la région de Los Angeles. Ces données comprennent des dizaines de milliers d’échantillons provenant de capteurs autoroutiers et urbains, ainsi que des problèmes réalistes tels que des relevés manquants, des mesures bruitées et des schémas de trafic irréguliers. Comparée à plusieurs modèles de prévision de pointe et aux schémas traditionnels de contrôle des signaux — horaires fixes et feux à réaction locale — la nouvelle approche a produit des prévisions de trafic à court terme plus précises et une synchronisation des feux plus efficiente. Elle a réduit les mesures d’erreur courantes pour la prévision d’environ un tiers par rapport aux meilleurs systèmes fixes et actionnés d’aujourd’hui, et dans les simulations elle a diminué les délais moyens et le nombre d’arrêts tout en faisant passer plus de véhicules par heure dans le réseau.

Ce que cela signifie pour les conducteurs au quotidien

Concrètement, MM-STMAP décrit un futur dans lequel les feux coopèrent et apprennent continuellement de l’expérience, au lieu de suivre aveuglément des cycles codés en dur. En anticipant où des bouchons sont sur le point de se former et en ajustant la synchronisation des feux sur plusieurs intersections, le système peut raccourcir les temps de trajet, lisser le trafic stop-and-go et réduire les ralentissements inutiles. Bien que l’approche doive encore relever des défis — comme la nécessité de données fiables et d’une puissance de calcul substantielle à l’échelle d’une ville — elle ouvre la voie à une mobilité urbaine plus intelligente et plus propre, où nos trajets quotidiens sont non seulement plus rapides mais aussi moins nuisibles pour l’environnement.

Citation: Wang, R., Zhang, J., Wang, X. et al. Multi-modal and multi-agent reinforcement learning framework for urban traffic flow prediction and signal control optimization. Sci Rep 16, 7612 (2026). https://doi.org/10.1038/s41598-026-37722-5

Mots-clés: trafic urbain, prévision du trafic, apprentissage par renforcement, feux intelligents, transport intelligent