Clear Sky Science · fr

Jeu de données pour l’analyse vidéo du trafic multi-perspectives

· Retour à l’index

Pourquoi plusieurs regards sur la rue comptent

Quiconque a tenté de traverser une rue animée sait que voitures, vélos et piétons se déplacent de façons parfois imprévisibles. Les villes se tournent vers les caméras et l’intelligence artificielle pour sécuriser ces espaces, mais la plupart des systèmes n’observent encore la chaussée que sous un seul angle. Cet article présente un nouveau jeu de données vidéo public qui filme le même passage piéton depuis trois points de vue simultanés, offrant aux chercheurs la matière première nécessaire pour concevoir des systèmes de circulation plus sûrs et plus intelligents.

Figure 1
Figure 1.

Un passage piéton, trois façons de voir

Le jeu de données se concentre sur une scène ordinaire : un passage piéton sur le campus de l’Université de Murcie en Espagne. Plutôt que de s’appuyer sur une seule caméra, les auteurs ont enregistré chaque événement avec trois dispositifs fonctionnant simultanément : une caméra montée sur une voiture en approche du passage, une caméra fixe sur un poteau en bord de route à une position surélevée, et une caméra embarquée sur un petit drone en vol stationnaire. Ensemble, ces vues captent les mêmes personnes et véhicules au niveau du sol, depuis le côté et depuis le ciel, reflétant étroitement la façon dont différents observateurs pourraient percevoir un même instant dans la vie réelle.

Capturer à la fois les traversées routinières et les accidents rares

Pour rendre les données utiles tant pour la surveillance quotidienne que pour les situations d’urgence, l’équipe a mis en scène deux types d’événements. Dans certaines séquences, les piétons traversent simplement pendant que la voiture s’arrête et attend, reflétant le comportement routinier. Dans d’autres, un acteur simule une chute sur le passage, suivant des trajectoires de mouvement conçues pour ressembler à un accident réel. La voiture suit toujours le même parcours et les piétons répètent les mêmes mouvements de base, ce qui permet aux chercheurs de comparer l’apparence de chaque scénario depuis les différentes caméras et d’étudier comment les événements inhabituels se distinguent des situations courantes.

Des rushes bruts à un carburant de recherche puissant

Une caractéristique clé du jeu de données est que les fichiers vidéo sont conservés bruts et non montés. Le seul traitement appliqué est l’ajout d’horodatages précis, plus un repère visuel simple : au début de chaque traversée, un piéton lève brièvement la main. Cela facilite la mise en correspondance des images des trois caméras afin d’étudier le même instant depuis chaque angle. Les 18 fichiers vidéo couvrent trois configurations de caméra et deux conditions de traversée (avec et sans chute) réparties sur trois agencements spatiaux différents de la voiture, de l’unité en bord de route et du drone. Les chercheurs reçoivent également des images supplémentaires décrivant les propriétés optiques exactes de l’objectif de la caméra en bord de route, ce qui les aide à corriger les distorsions si nécessaire.

Figure 2
Figure 2.

Tester la capacité des machines à comprendre la scène

Pour vérifier l’utilité réelle du jeu de données, les auteurs ont exécuté des tests standard de détection d’objets, comparant leurs enregistrements à des collections vidéo de trafic bien connues telles que KITTI, VisDrone et UA-DETRAC. Ils ont utilisé des modèles modernes de détection pour localiser les personnes dans les vidéos et mesuré dans quelle mesure les formes prédites correspondaient aux contours vérifiés par des humains. En moyenne, le nouveau jeu de données a fourni de meilleurs scores tant pour la précision des détections que pour l’alignement des boîtes englobantes. En examinant la fréquence à laquelle chaque personne était visible dans une, deux ou trois vues, l’équipe a aussi montré que le recouvrement des caméras réduit fortement les angles morts lorsque les personnes sont masquées par des voitures ou du mobilier urbain.

Ce que cela signifie pour les rues de demain

Pour un public non spécialiste, le message principal est que ce jeu de données offre une image beaucoup plus complète de ce qui se passe à un passage piéton que les collections précédentes. En combinant vues embarquée, en bord de route et aérienne de façon synchronisée, il fournit aux ingénieurs et aux scientifiques un banc d’essai réaliste pour développer des systèmes de circulation capables de suivre les personnes plus fiablement, de détecter rapidement les accidents et de gérer les complications du monde réel comme les obstacles et les changements de point de vue. À long terme, des ressources comme celle-ci peuvent contribuer à rendre les traversées plus sûres, les feux de circulation plus réactifs et les services urbains plus intelligents pour mieux protéger tous les usagers de la route.

Citation: Sanchez-Iborra, R., Kouvakis, V., Trevlakis, S.E. et al. Dataset for multi-perspective traffic video analysis. Sci Data 13, 543 (2026). https://doi.org/10.1038/s41597-026-06907-y

Mots-clés: surveillance du trafic, vidéo multi-vues, sécurité des piétons, villes intelligentes, jeu de données vision par ordinateur