Clear Sky Science · tr

YOLOv4 ve DeepSORT kullanarak topluluk ve kalabalık yayılma akışını tahmin etme

· Dizine geri dön

Neden kalabalıkları yukarıdan izlemek önemli

Milyonlarca insan bir araya geldiğinde, basit bir sendeleme ya da ani bir koşu birkaç saniyede tehlikeli hâle gelebilir. Suudi Arabistan’daki yıllık Hac ve Umre ibadetleri dört milyona kadar mü’min çekerek dünyanın en yoğun kalabalıklarından bazılarını oluşturur. Bu makale, yapay zekânın bu geniş hareketli kalabalıkları kameralar aracılığıyla nasıl izleyebileceğini, insanları otomatik olarak sayabileceğini, hareketlerini takip edebileceğini ve tehlikeli sıkışmalar oluşmadan önce yetkilileri nasıl uyarabileceğini inceliyor.

Büyük toplanmalar, büyük riskler

Geleneksel kalabalık kontrolü insan gözlemciler, sabit bariyerler ve dikkatle planlanmış rotalara dayanır. Ancak insan gözü yorulur ve kalabalıklar beklenmedik şekilde davranır. Hac sırasında ibadet edenler yürüyüş yolları, yollar ve açık meydanlar boyunca önemli kutsal noktalar arasında hareket eder; bunlar hızla darboğazlara dönüşebilir. Yazarlar, insanları daha güvende tutmak için yetkililerin gerçek zamanlı olarak tüm resmi görebilen araçlara ihtiyaç duyduğunu savunuyor: insanların nerede yoğunlaştığı, nerelerde açıldıkları ve bir alanı ne kadar hızlı girip çıktıkları.

Bilgisayarlara insan görmesini öğretmek

Böyle bir araç oluşturmak için araştırmacılar iki gelişmiş bilgisayarla görme yöntemini kullanıyor. Birincisi, YOLOv4 adı verilen yöntem, sıkışık sahnelerde bile her kişinin etrafına kutular çizerek görüntülerde insanları tespit edecek şekilde eğitiliyor. İkincisi, DeepSORT adlı yöntem bu tespitleri alıp her kişiyi birçok video karesinde izliyor ve her birine görünmez bir kimlik vererek zaman içinde yollarının izlenebilmesini sağlıyor. Ekip, Arafat Dağı çevresindeki birkaç alanda çekilmiş 2019 Hacı verilerinden oluşan geniş bir görüntü ve video koleksiyonu derledi. On binlerce insan başını ve vücudunu dikkatle etiketlediler, bulanık materyalleri temizlediler ve sistemin farklı aydınlatma, açı ve kalabalık yoğunlukları altında güvenilir kalması için veriyi küçük varyasyonlarla zenginleştirdiler.

Figure 1
Figure 1.

Hareket eden noktalardan kalabalık seviyelerine

Sistem bireyleri bulup takip etmeye başladıktan sonra, bu hareket eden noktaları kalabalığın nasıl davrandığına dair bir görünüme dönüştürebilir. Belirli bir alana giren ve çıkan kişi sayısını ve ne kadar sıkışık olduklarını sayarak sistem, kalabalık yoğunluğunu üç sezgisel seviyeye sınıflandırır: düşük, orta ve yüksek. Kaba tahminlere veya gecikmiş raporlara dayanmak yerine yöneticiler insanların nerede düzenli şekilde dağıldığını ve nerede kritik tıkanma noktalarının oluştuğunu görebilir. DeepSORT, insanların birbirini görüşten engellemesi ve görsel olarak çok benzer görünmeleri durumuyla (hacıların çoğunlukla beyaz giysileri gibi) başa çıkacak şekilde tasarlandığından, yoğun ve görsel olarak kafa karıştırıcı sahnelerde bile tutarlı izler koruyabilir.

Sistemin performansı ne kadar iyi

Yazarlar kurulumlarını kapsamlı şekilde test ettiler. YOLO ailesinin birkaç versiyonunu ve farklı takip yöntemlerini karşılaştırdılar; nihayetinde YOLOv4 ile DeepSORT eşlemesinin gerçek Hac görüntülerinde en iyi performansı verdiğini buldular. Modelleri ayarlayıp küratörlüğünü yaptıkları veri kümesinde eğittikten sonra, YOLOv4 insanların tespitinde %95’in üzerinde doğruluk ve kaçırılan tespitlerle yanlış alarmlar arasındaki çok yüksek dengesiyle başarılı oldu. DeepSORT bireyleri %91’in üzerinde doğrulukla takip etti, kısa süreli olarak başkalarının arkasına gizlendiklerinde bile yollarını kurtardı. Trafik, sosyal mesafe izleme veya diğer kalabalık sahneler için kullanılan benzer sistemlerle kıyaslandığında, bu Hac odaklı yaklaşım en iyi raporlanan sonuçlara eşit veya onlardan daha iyi sonuçlar verdi ve en zorlu ortamlardan birinde çalıştı.

Figure 2
Figure 2.

Yerelde bunun anlamı ne olabilir

Pratikte böyle bir sistem mevcut gözetim kameralarının arkasında çalışarak hacıların nasıl hareket ettiğini sürekli izleyebilir. Bir yaya yolundaki kişi sayısı güvenli sınırına yaklaştığında veya bir meydan düzensiz şekilde dolmaya başladığında yazılım yetkililere bariyerleri ayarlamaları, akışları yönlendirmeleri veya sahadaki gönüllülere mesaj göndermeleri için uyarı verebilir. Güvenliğin ötesinde, aynı içgörüler tıbbi ekiplerin, tuvaletlerin ve ulaşım bağlantılarının nerede konumlandırılacağını iyileştirebilir ve gelecek sezonlar için rotaların tahmin yerine gerçek veriye dayalı olarak yeniden tasarlanmasına yardımcı olabilir. Yazarlar ayrıca aynı yaklaşımın büyük spor etkinlikleri, konserler veya festivallerde de yardımcı olabileceğine dikkat çekiyor.

Kitleleri yönlendirmek için daha akıllı, daha güvenli bir yol

Bir teknik olmayan için ana çıkarım basit: bilgisayarlar artık devasa kalabalıkları herhangi bir insan ekibinden daha dikkatli ve tutarlı şekilde izleyebiliyor; ham videoyu erken uyarılara ve uygulanabilir rehberliğe dönüştürebiliyorlar. Kişi tespiti ve takibini tek, sağlam bir sistemde birleştirerek bu araştırma milyonlarca ibadetçinin akışını gerçek zamanlı izleyebilmenin, her alanın ne kadar kalabalık olduğunu sınıflandırabilmenin ve durumlar tehlikeli hâle gelmeden önce müdahale edebilmenin mümkün olduğunu gösteriyor. Daha ileri geliştirilip sorumlu şekilde konuşlandırılırsa, bu tür araçlar büyük dini toplanmaları ve diğer kitlesel etkinlikleri herkes için daha güvenli, daha düzenli ve daha az stresli hâle getirebilir.

Atıf: Aljojo, N., Ardah, H., Alamri, A. et al. Predicting congregational and crowd spread-out flow using YOLOv4 and DeepSORT. Sci Rep 16, 13869 (2026). https://doi.org/10.1038/s41598-026-44719-7

Anahtar kelimeler: kalabalık yönetimi, bilgisayarla görme, Hac güvenliği, nesne takibi, derin öğrenme