Clear Sky Science · it

Prevedere la dispersione e il flusso delle folle usando YOLOv4 e DeepSORT

· Torna all'indice

Perché osservare le folle dall'alto è importante

Quando milioni di persone si radunano in un unico luogo, una semplice caduta o una corsa improvvisa possono diventare pericolose in pochi secondi. I pellegrinaggi annuali dell'Hajj e dell'Umrah in Arabia Saudita attirano fino a quattro milioni di fedeli, creando alcune delle folle più dense al mondo. Questo articolo esplora come l'intelligenza artificiale possa osservare queste vaste masse in movimento attraverso telecamere, contare automaticamente le persone, seguire i loro spostamenti e avvisare le autorità prima che si generino congestionamenti pericolosi.

Grandi assembramenti, grandi rischi

Il controllo tradizionale delle folle si basa su osservatori umani, barriere fisse e percorsi pianificati con cura. Ma gli occhi umani si affaticano e le folle si comportano in modo imprevedibile. Durante l'Hajj, i pellegrini si spostano tra siti sacri lungo passaggi, strade e piazze aperte che possono rapidamente trasformarsi in strozzature. Gli autori sostengono che, per mantenere le persone più al sicuro, i responsabili abbiano bisogno di strumenti in grado di vedere l'intera situazione in tempo reale: dove le persone sono dense, dove si stanno diradando e quanto rapidamente entrano o lasciano un'area.

Insegnare ai computer a vedere le persone

Per costruire uno strumento del genere, i ricercatori utilizzano due avanzati metodi di visione artificiale. Il primo, chiamato YOLOv4, è addestrato a individuare le persone nelle immagini tracciando riquadri intorno a ciascuna persona, anche in scene molto affollate. Il secondo, chiamato DeepSORT, prende queste rilevazioni e segue ogni persona attraverso molti fotogrammi video, assegnando a ciascuna un ID invisibile in modo che il loro percorso possa essere ricostruito nel tempo. Il team ha raccolto un ampio insieme di immagini e video dell'Hajj 2019, ripresi in diverse aree intorno al Monte Arafat. Hanno etichettato con cura decine di migliaia di teste e corpi umani, rimosso materiale sfocato e aumentato i dati con piccole variazioni in modo che il sistema rimanesse affidabile con diverse condizioni di illuminazione, angolazioni e densità di folla.

Figure 1
Figura 1.

Dai punti in movimento ai livelli di folla

Una volta che il sistema è in grado di individuare e seguire gli individui, può trasformare questi punti in movimento in un quadro del comportamento della folla. Contando quante persone entrano e escono da una data area e quanto sono strettamente raggruppate, il sistema classifica la densità della folla in tre livelli intuitivi: bassa, media e alta. Invece di affidarsi a stime approssimative o a rapporti ritardati, i gestori possono vedere dove le persone si stanno distribuendo agevolmente e dove si stanno formando strozzature critiche. Poiché DeepSORT è progettato per affrontare situazioni in cui le persone si bloccano a vicenda dalla vista e appaiono molto simili (come nell'abbigliamento prevalentemente bianco dei pellegrini), può mantenere tracciamenti stabili anche in scene dense e visivamente confuse.

Quanto bene funziona il sistema

Gli autori hanno testato a fondo la loro configurazione. Hanno confrontato diverse versioni della famiglia YOLO e vari metodi di tracciamento, trovando alla fine che YOLOv4 abbinato a DeepSORT dava le migliori prestazioni sui filmati reali dell'Hajj. Dopo aver ottimizzato i modelli e addestrati sul dataset curato, YOLOv4 ha rilevato correttamente le persone con oltre il 95% di accuratezza e un ottimo equilibrio tra mancati rilevamenti e falsi allarmi. DeepSORT ha tracciato gli individui con più del 91% di accuratezza, ricostruendo i loro percorsi anche quando venivano temporaneamente nascosti da altri. Rispetto a sistemi simili usati per il traffico, il monitoraggio del distanziamento sociale o altre scene di folla, questo approccio focalizzato sull'Hajj eguaglia o supera i migliori risultati riportati, funzionando in uno degli ambienti più impegnativi.

Figure 2
Figura 2.

Cosa potrebbe significare sul campo

In pratica, un sistema del genere potrebbe agire dietro le telecamere di sorveglianza esistenti e monitorare continuamente come si muovono i pellegrini. Quando il numero di persone in un passaggio si avvicina al limite di sicurezza, o quando una piazza comincia a riempirsi in modo disomogeneo, il software potrebbe avvisare i funzionari per regolare le barriere, reindirizzare i flussi o inviare messaggi ai volontari sul posto. Oltre alla sicurezza, le stesse informazioni potrebbero migliorare la collocazione di squadre mediche, servizi igienici e collegamenti di trasporto, e aiutare i pianificatori a riprogettare i percorsi per le stagioni future basandosi su dati reali anziché su supposizioni. Gli autori osservano inoltre che lo stesso approccio potrebbe essere utile in grandi eventi sportivi, concerti o festival.

Un modo più intelligente e sicuro di guidare le masse

Per un lettore non specialista, la conclusione principale è semplice: i computer possono ora osservare folle enormi con più attenzione e costanza di qualsiasi squadra umana, trasformando video grezzi in avvisi precoci e indicazioni pratiche. Combinando il rilevamento delle persone e il tracciamento in un sistema robusto, questa ricerca dimostra che è possibile monitorare in tempo reale il flusso di milioni di pellegrini, classificare quanto affollata sia ogni area e intervenire prima che le situazioni diventino pericolose. Se sviluppati ulteriormente e impiegati con responsabilità, tali strumenti potrebbero rendere i grandi raduni religiosi e altri eventi di massa più sicuri, più fluidi e meno stressanti per tutti i partecipanti.

Citazione: Aljojo, N., Ardah, H., Alamri, A. et al. Predicting congregational and crowd spread-out flow using YOLOv4 and DeepSORT. Sci Rep 16, 13869 (2026). https://doi.org/10.1038/s41598-026-44719-7

Parole chiave: gestione della folla, visione artificiale, sicurezza dell'Hajj, tracciamento di oggetti, apprendimento profondo