Clear Sky Science · it

Dataset per l'analisi video del traffico da prospettive multiple

· Torna all'indice

Perché molti occhi sulla strada contano

Chiunque abbia provato ad attraversare una strada trafficata sa che auto, biciclette e pedoni si muovono in modi spesso difficili da prevedere. Le città si stanno rivolgendo a telecamere e intelligenza artificiale per rendere questi spazi più sicuri, ma la maggior parte dei sistemi osserva ancora la strada da un solo angolo. Questo articolo presenta un nuovo dataset video pubblico che osserva lo stesso attraversamento pedonale da tre punti di vista diversi contemporaneamente, offrendo ai ricercatori il materiale grezzo e ricco necessario per costruire sistemi di traffico più sicuri e intelligenti.

Figure 1
Figure 1.

Un attraversamento, tre modi di vedere

Il dataset si concentra su una singola scena quotidiana: un attraversamento del campus dell'Università di Murcia in Spagna. Invece di affidarsi a una sola videocamera, gli autori hanno registrato ogni evento con tre dispositivi che funzionavano simultaneamente: una telecamera montata su un'auto in avvicinamento all'attraversamento, una videocamera fissa su un palo stradale in posizione elevata e una telecamera su un piccolo drone che sorvolava dall'alto. Insieme, queste visuali catturano le stesse persone e i veicoli da livello stradale, di lato e dall'alto, rispecchiando da vicino come diversi osservatori potrebbero vedere lo stesso istante nella vita reale.

Riprendere sia le passeggiate di routine sia gli incidenti rari

Per rendere i dati utili sia per il monitoraggio quotidiano sia per le emergenze, il team ha messo in scena due tipi di eventi. In alcune registrazioni i pedoni attraversano semplicemente mentre l'auto si ferma e attende, riflettendo il comportamento normale del traffico. In altre, un attore simula una caduta mentre si trova sull'attraversamento, seguendo pattern di movimento pensati per assomigliare a un incidente reale. L'auto segue sempre lo stesso percorso e i pedoni ripetono gli stessi movimenti di base, così i ricercatori possono confrontare come ogni scenario appare dalle diverse telecamere e studiare come gli eventi insoliti si distinguono da quelli di routine.

Dal filmato grezzo a un carburante potente per la ricerca

Una caratteristica chiave del dataset è che i file video sono mantenuti grezzi e non modificati. L'unica elaborazione consiste nell'aggiunta di timestamp precisi, più un semplice segnale visivo: all'inizio di ogni attraversamento un pedone alza brevemente la mano. Questo rende semplice allineare i frame di tutte e tre le telecamere in modo che lo stesso istante temporale possa essere studiato da ogni angolazione. I 18 file video coprono tre configurazioni di telecamere e due condizioni di attraversamento (con e senza caduta) attraverso tre diverse disposizioni spaziali di auto, unità a lato strada e drone. I ricercatori ricevono inoltre immagini aggiuntive che descrivono le esatte proprietà ottiche dell'obiettivo della videocamera a lato strada, aiutandoli a correggere le distorsioni quando necessario.

Figure 2
Figure 2.

Mettere alla prova quanto le macchine comprendono la scena

Per verificare l'utilità del dataset, gli autori hanno eseguito test standard di rilevamento degli oggetti, confrontando le loro registrazioni con collezioni video del traffico ben note come KITTI, VisDrone e UA-DETRAC. Hanno usato modelli di rilevamento moderni per localizzare le persone nei video e hanno misurato quanto accuratamente le forme previste corrispondessero ai contorni verificati dall'uomo. In media, il nuovo dataset ha prodotto punteggi più elevati sia per la precisione delle rilevazioni sia per l'allineamento delle forme di delimitazione. Esaminando quanto spesso ogni persona fosse visibile in una, due o tutte e tre le visuali, il team ha inoltre dimostrato che la sovrapposizione delle coperture dalle diverse telecamere riduce notevolmente i punti ciechi quando le persone sono nascoste dietro auto o arredi stradali.

Cosa significa per le strade del futuro

Per i non specialisti, il messaggio principale è che questo dataset offre un quadro molto più completo di ciò che accade a un attraversamento rispetto alle raccolte precedenti. Combinando viste dall'auto, dal lato strada e dall'alto in modo sincronizzato, fornisce a ingegneri e scienziati un banco di prova realistico per costruire sistemi di traffico in grado di tracciare le persone con maggiore affidabilità, rilevare rapidamente gli incidenti e affrontare complicazioni del mondo reale come ostacoli e cambiamenti di prospettiva. A lungo termine, risorse come questa possono contribuire a attraversamenti più sicuri, semafori più reattivi e servizi urbani più intelligenti che proteggono meglio tutti gli utenti della strada.

Citazione: Sanchez-Iborra, R., Kouvakis, V., Trevlakis, S.E. et al. Dataset for multi-perspective traffic video analysis. Sci Data 13, 543 (2026). https://doi.org/10.1038/s41597-026-06907-y

Parole chiave: sorveglianza del traffico, video multi-vista, sicurezza dei pedoni, città intelligenti, dataset per visione artificiale