Clear Sky Science · de

Datensatz zur multiperspektivischen Verkehrsvideoanalyse

· Zurück zur Übersicht

Warum viele Augen auf der Straße wichtig sind

Wer schon einmal versucht hat, eine belebte Straße zu überqueren, weiß, dass Autos, Fahrräder und Fußgänger sich oft auf schwer vorhersehbare Weise bewegen. Städte setzen zunehmend Kameras und künstliche Intelligenz ein, um diese Bereiche sicherer zu machen, doch die meisten Systeme betrachten die Straße noch aus nur einem Blickwinkel. Dieses Papier stellt einen neuen öffentlichen Videodatensatz vor, der denselben Zebrastreifen gleichzeitig aus drei verschiedenen Perspektiven aufzeichnet und Forschern das reichhaltige Ausgangsmaterial liefert, das sie benötigen, um sicherere, intelligentere Verkehrssysteme zu entwickeln.

Figure 1
Figure 1.

Ein Zebrastreifen, drei Blickweisen

Der Datensatz konzentriert sich auf eine einzige, alltägliche Szene: einen Campus-Zebrastreifen der Universität von Murcia in Spanien. Statt sich auf eine Kamera zu verlassen, nahmen die Autoren jedes Ereignis mit drei gleichzeitig arbeitenden Geräten auf: einer Kamera, die an einem sich dem Zebrastreifen nähernden Auto montiert war, einer fest installierten Kamera an einem erhöhten Straßenpfosten und einer kleinen Drohne, die darüber schwebte. Zusammen erfassen diese Ansichten dieselben Personen und Fahrzeuge aus Bodennähe, von der Seite und aus der Luft und spiegeln damit gut wider, wie verschiedene Beobachter denselben Moment im realen Leben sehen könnten.

Alltägliche Wege und seltene Zwischenfälle erfassen

Um die Daten sowohl für die tägliche Überwachung als auch für Notfallsituationen nützlich zu machen, inszenierte das Team zwei Arten von Ereignissen. In einigen Aufnahmen überqueren Fußgänger einfach den Zebrastreifen, während das Auto anhält und wartet, was normales Verkehrsverhalten widerspiegelt. In anderen simuliert ein Darsteller einen Sturz auf dem Zebrastreifen, wobei Bewegungsmuster nachgestellt wurden, die einem echten Unfall ähneln sollen. Das Auto folgt stets derselben Route und die Fußgänger wiederholen die gleichen Grundbewegungen, sodass Forscher vergleichen können, wie jedes Szenario aus den verschiedenen Kameras aussieht und wie ungewöhnliche Ereignisse sich von Routinesituationen abheben.

Von Rohmaterial zu kraftvollem Forschungstreibstoff

Ein zentrales Merkmal des Datensatzes ist, dass die Videodateien roh und unbearbeitet bleiben. Die einzige Verarbeitung besteht in der Hinzufügung präziser Zeitstempel sowie eines einfachen visuellen Signals: Zu Beginn jeder Überquerung hebt ein Fußgänger kurz die Hand. Dadurch lässt sich der gleiche Zeitpunkt in den Aufnahmen aller drei Kameras leicht synchronisieren, sodass derselbe Moment aus jeder Perspektive untersucht werden kann. Die 18 Videodateien decken drei Kamerakonfigurationen und zwei Überquerungsbedingungen (mit und ohne Sturz) über drei verschiedene räumliche Anordnungen von Auto, Straßeninstallation und Drohne ab. Forschende erhalten zudem zusätzliche Bilder, die die genauen optischen Eigenschaften des Objektivs der Straßenkamera beschreiben und ihnen helfen, Verzerrungen bei Bedarf zu korrigieren.

Figure 2
Figure 2.

Prüfen, wie gut Maschinen die Szene verstehen

Um zu prüfen, dass der Datensatz tatsächlich nützlich ist, führten die Autoren standardisierte Objekterkennungstests durch und verglichen ihre Aufnahmen mit bekannten Verkehrsvideokollektionen wie KITTI, VisDrone und UA-DETRAC. Sie setzten moderne Erkennungsmodelle ein, um Personen in den Videos zu lokalisieren, und maßen, wie genau die vorhergesagten Formen mit menschlich verifizierten Umrissen übereinstimmten. Im Durchschnitt lieferte der neue Datensatz höhere Werte sowohl für die Präzision der Erkennungen als auch für die Übereinstimmung der umgebenden Formen. Indem das Team untersuchte, wie oft jede Person in einer, zwei oder allen drei Ansichten sichtbar war, zeigte es außerdem, dass sich überlappende Abdeckung durch die verschiedenen Kameras die toten Winkel deutlich reduziert, wenn Personen hinter Autos oder Straßenmöbeln verborgen sind.

Was das für künftige Straßen bedeutet

Für Nichtfachleute ist die Kernbotschaft, dass dieser Datensatz ein deutlich vollständigeres Bild davon bietet, was an einem Zebrastreifen geschieht, als frühere Sammlungen. Durch die kombinierte, synchronisierte Nutzung von Fahrzeug-, Straßen- und Luftaufnahmen bietet er Ingenieuren und Wissenschaftlern eine realistische Testumgebung, um Verkehrssysteme zu entwickeln, die Personen zuverlässiger verfolgen, Unfälle schneller erkennen und mit realen Komplikationen wie Hindernissen und wechselnden Blickwinkeln umgehen können. Langfristig können Ressourcen wie diese dazu beitragen, sichere Überquerungen, reaktionsfähigere Ampeln und intelligentere Stadtdienste zu ermöglichen, die alle Verkehrsteilnehmenden besser schützen.

Zitation: Sanchez-Iborra, R., Kouvakis, V., Trevlakis, S.E. et al. Dataset for multi-perspective traffic video analysis. Sci Data 13, 543 (2026). https://doi.org/10.1038/s41597-026-06907-y

Schlüsselwörter: Verkehrsüberwachung, Mehransichten-Video, Fußgängersicherheit, intelligente Städte, Computer-Vision-Datensatz