Clear Sky Science · sv

Datamängd för multiperspektiv trafikvideoanalys

· Tillbaka till index

Varför många ögon på gatan spelar roll

Den som försökt korsa en trafikerad gata vet att bilar, cyklar och människor rör sig på sätt som kan vara svåra att förutsäga. Städer vänder sig i allt större utsträckning till kameror och artificiell intelligens för att hålla dessa platser säkra, men de flesta system ser fortfarande vägen ur bara en vinkel. Denna artikel presenterar en ny offentlig videodatamängd som bevakar samma övergångsställe från tre olika synvinklar samtidigt, och ger forskare det rika råmaterial de behöver för att bygga säkrare, smartare trafiksystem.

Figure 1
Figure 1.

Ett övergångsställe, tre sätt att se

Datamängden fokuserar på en enkel, vardaglig scen: ett campusövergångsställe vid Universidad de Murcia i Spanien. Istället för att förlita sig på en kamera spelade författarna in varje händelse med tre enheter som arbetade samtidigt: en kamera monterad på en rörlig bil som närmar sig övergångsstället, en kamera fixerad på en vägkantspåle i förhöjd position, och en kamera på en liten drönare som hovrar ovanför. Tillsammans fångar dessa vyer samma människor och fordon från marknivå, från sidan och från luften, vilket speglar hur olika iakttagare kan se samma ögonblick i verkligheten.

Att fånga både rutinmässiga promenader och sällsynta olyckor

För att göra datan användbar både för vardaglig övervakning och för nödsituationer iscensatte teamet två typer av händelser. I vissa inspelningar går fotgängare helt enkelt över medan bilen stannar och väntar, vilket återspeglar normal trafikbeteende. I andra simulerar en skådespelare ett fall på övergångsstället, med rörelsemönster avsedda att likna en verklig olycka. Bilen följer alltid samma rutt och fotgängarna upprepar samma grundläggande rörelser, så att forskare kan jämföra hur varje scenario ser ut från de olika kamerorna och studera hur ovanliga händelser sticker ut från rutinmässiga.

Från råinspelning till kraftfullt forskningsbränsle

En viktig egenskap i datamängden är att videofilerna bevaras råa och oredigerade. Den enda bearbetningen är tillägget av precisa tidsstämplar, plus en enkel visuell markör: i början av varje övergång höjer en fotgängare kort handen. Detta gör det enkelt att synkronisera bildrutor från alla tre kameror så att samma ögonblick i tiden kan studeras ur varje vinkel. De 18 videofilerna täcker tre kamerauppsättningar och två övergångstillstånd (med och utan fall) över tre olika rumsliga arrangemang av bil, vägkameranhet och drönare. Forskare får också extra bilder som beskriver de exakta optiska egenskaperna hos vägkamerans objektiv, vilket hjälper dem att korrigera för distorsion vid behov.

Figure 2
Figure 2.

Att testa hur väl maskiner förstår scenen

För att kontrollera att datamängden verkligen är användbar genomförde författarna standardtester för objektdetektion och jämförde sina inspelningar med välkända trafikvideokollektioner som KITTI, VisDrone och UA-DETRAC. De använde moderna detektionsmodeller för att lokalisera personer i videorna och mätte hur noggrant de predikterade formerna stämde överens med människoverifierade konturer. I genomsnitt gav den nya datamängden högre poäng både för detektionsprecision och för anpassningen av begränsande former. Genom att undersöka hur ofta varje person var synlig i en, två eller alla tre vyer visade teamet också att överlappande täckning från de olika kamerorna kraftigt minskar blinda fläckar när personer är dolda bakom bilar eller gatutrustning.

Vad detta betyder för framtidens gator

För icke-specialister är huvudbudskapet att denna datamängd erbjuder en mycket mer komplett bild av vad som händer vid ett övergångsställe än tidigare samlingar. Genom att kombinera bil-, väg- och luftperspektiv på ett synkroniserat sätt ger den ingenjörer och forskare en realistisk testmiljö för att bygga trafiksystem som kan spåra människor mer tillförlitligt, upptäcka olyckor snabbt och hantera verkliga komplikationer som hinder och förändrade synvinklar. På lång sikt kan resurser som denna hjälpa till att driva säkrare övergångar, mer responsiva trafikljus och smartare stadstjänster som bättre skyddar alla som använder vägen.

Citering: Sanchez-Iborra, R., Kouvakis, V., Trevlakis, S.E. et al. Dataset for multi-perspective traffic video analysis. Sci Data 13, 543 (2026). https://doi.org/10.1038/s41597-026-06907-y

Nyckelord: trafikövervakning, flerkameravideo, gångsäkerhet, smarta städer, datorvisionsdatamängd