Clear Sky Science · ar

التنبؤ بتدفق التجمّعات وتفرّق الحشود باستخدام YOLOv4 وDeepSORT

· العودة إلى الفهرس

لماذا يهم مراقبة الحشود من الأعلى

عندما يتجمع ملايين الأشخاص في مكان واحد، قد يتحول تعثر بسيط أو اندفاع مفاجئ إلى خطر في ثوانٍ. تجمع مناسكا الحج والعمرة السنويتان في المملكة العربية السعودية ما يصل إلى أربعة ملايين مصلٍ، مكونة بعضًا من أكثر الحشود كثافة على مستوى العالم. تستعرض هذه الورقة كيف يمكن للذكاء الاصطناعي مراقبة هذه الحشود المتحركة الضخمة عبر الكاميرات، وعدّ الأشخاص تلقائيًا، وتتبع حركتهم، وتحذير السلطات قبل أن تتكوّن ازدحامات خطرة.

تجمعات كبيرة، مخاطر كبيرة

تعتمد السيطرة التقليدية على الحشود على مراقبين بشريين وحواجز ثابتة ومسارات مخططة بعناية. لكن العيون البشرية تتعب، والسلوك الجمعي قد يكون غير متوقع. خلال الحج، ينتقل الحجاج بين مواقع مقدّسة رئيسية على ممرات وطرق وساحات مفتوحة يمكن أن تصبح بسرعة عنق زجاجة. يرى المؤلفون أنه للحفاظ على سلامة الناس، يحتاج المسؤولون إلى أدوات تستطيع رؤية الصورة كاملة في الزمن الحقيقي: أين تتركز الحشود، وأين تتفرّق، ومدى سرعة دخولهم أو خروجهم من مساحة ما.

تعليم الحواسيب رؤية الناس

لبناء مثل هذه الأداة، استخدم الباحثون طريقتين متقدمتين في رؤية الحاسوب. الأولى، المسماة YOLOv4، تم تدريبها لاكتشاف الأشخاص في الصور عن طريق رسم مربعات حول كل شخص، حتى في المشاهد المكتظة. الثانية، المسماة DeepSORT، تأخذ تلك الاكتشافات وتتابع كل شخص عبر إطارات الفيديو المتتابعة، مع منح كل واحد معرفًا خفيًا بحيث يمكن تتبع مساره مع مرور الوقت. جمع الفريق مجموعة كبيرة من الصور والفيديو من حج 2019، مأخوذة في عدة مناطق حول جبل عرفات. وسمّوا بعناية عشرات الآلاف من الرؤوس والأجسام البشرية، ونقّحوا المواد الضبابية، وعزّزوا البيانات بتغييرات صغيرة حتى تظل النظام موثوقًا تحت ظروف إضاءة وزوايا وكثافات حشد مختلفة.

Figure 1
الشكل 1.

من نقاط متحركة إلى مستويات الحشد

بمجرد أن يتمكن النظام من العثور على الأفراد وتتبعهم، يستطيع تحويل هذه النقاط المتحركة إلى صورة لسلوك الحشد. عن طريق عدّ عدد الأشخاص الداخلين والخارجين من منطقة معينة ومدى تقاربهم، يصنّف النظام كثافة الحشد إلى ثلاث مستويات بديهية: منخفضة ومتوسطة وعالية. بدلاً من الاعتماد على تقديرات تقريبية أو تقارير متأخرة، يمكن للمديرين رؤية أين يتفرّق الناس بسلاسة وأين تتشكل نقاط اختناق حرجة. وبما أن DeepSORT مصمم للتعامل مع حجب الأشخاص لبعضهم البعض من المشهد وظهورهم المتشابه (كما في ملابس الحجاج البيضاء غالبًا)، فإنه يستطيع الحفاظ على مسارات ثابتة حتى في مشاهد كثيفة ومربكة بصريًا.

مدى جودة أداء النظام

اختبر المؤلفون إعدادهم بدقّة. قارنوا عدة إصدارات من عائلة YOLO بالإضافة إلى طرق تتبّع مختلفة، ووجدوا في النهاية أن اقتران YOLOv4 مع DeepSORT قدّم أفضل أداء على لقطات الحج الحقيقية. بعد ضبط النماذج وتدريبها على مجموعة البيانات المصنفة، اكتشف YOLOv4 الأشخاص بدقة تزيد على 95% وبتوازن عالٍ جدًا بين عمليات الاكتشاف الفائتة والإنذارات الكاذبة. وتتبع DeepSORT الأفراد بدقة تفوق 91%، مستعيدًا مساراتهم حتى عندما اختفوا مؤقتًا خلف آخرين. بالمقارنة مع أنظمة مماثلة تُستخدم في مراقبة المرور أو الالتزام بالتباعد الاجتماعي أو مشاهد الحشود الأخرى، تطابق هذا النهج المخصص للحج أو تجاوز أفضل النتائج المبلغ عنها بينما يعمل في واحد من أكثر البيئات تحديًا.

Figure 2
الشكل 2.

ما الذي قد يعنيه ذلك ميدانيًا

عمليًا، يمكن لمثل هذا النظام أن يعمل على الكاميرات القائمة ويُراقب باستمرار حركة الحجاج. عندما يقترب عدد الأشخاص في ممر من الحد الآمن، أو عندما تبدأ ساحة في الامتلاء بشكل غير متساوٍ، يمكن للبرنامج تنبيه الجهات المسؤولة لتعديل الحواجز، أو إعادة توجيه التدفقات، أو إرسال رسائل إلى المتطوعين على الأرض. بالإضافة إلى السلامة، يمكن أن تحسّن نفس الرؤى من أماكن تواجد الفرق الطبية والمراحيض ووسائل النقل، ويمكن أن تساعد المخططين في إعادة تصميم المسارات للمواسم القادمة استنادًا إلى بيانات حقيقية بدلاً من التخمين. ويشير المؤلفون أيضًا إلى أن نفس النهج قد يفيد في الفعاليات الرياضية الكبرى والحفلات أو المهرجانات.

طريقة أذكى وأكثر أمانًا لتوجيه الجماهير

لغير المتخصص، الخلاصة بسيطة: يمكن للحواسيب الآن مراقبة الحشود الضخمة بعناية وبشكل أكثر اتساقًا من أي فريق بشري، وتحويل الفيديو الخام إلى تحذيرات مبكرة وإرشادات عملية. بدمج اكتشاف الأشخاص وتتبعهم في نظام واحد قوي، يظهر هذا البحث إمكانية مراقبة تدفق ملايين المصلين في الزمن الحقيقي، وتصنيف مدى ازدحام كل منطقة، والتحرك قبل أن تصبح الحالات خطرة. إذا طُورت هذه الأدوات بمزيد من العمل ونُشرت بمسؤولية، فقد تجعل التجمعات الدينية الكبيرة والفعاليات الجماهيرية الأخرى أكثر أمانًا وسلاسة وأقل إجهادًا للجميع.

الاستشهاد: Aljojo, N., Ardah, H., Alamri, A. et al. Predicting congregational and crowd spread-out flow using YOLOv4 and DeepSORT. Sci Rep 16, 13869 (2026). https://doi.org/10.1038/s41598-026-44719-7

الكلمات المفتاحية: إدارة الحشود, رؤية الحاسوب, سلامة الحج, تتبّع الأجسام, التعلّم العميق