Clear Sky Science · he

חיזוי זרימת מפולגת של המונים וקהל באמצעות YOLOv4 ו-DeepSORT

· חזרה לאינדקס

מדוע צפייה במונים מלמעלה חשובה

כשמיליונים של אנשים מתכנסים במקום אחד, מעידה פשוטה או דחיפה פתאומית עלולים להפוך למסוכנים תוך שניות. עליות הרגל השנתיות של החג׳ והעומרה בערב הסעודית מושכות עד כארבעה מיליון מתפללים, ויוצרות חלק מהקהל הצפוף ביותר על פני כדור הארץ. מאמר זה בוחן כיצד בינה מלאכותית יכולה לצפות בקהלים נעים עצומים אלה דרך מצלמות, לספור אנשים באופן אוטומטי, לעקוב אחר תנועתם ולהתריע בפני הרשויות לפני שהצפיפות המסוכנת מתגבש.

כינוסים גדולים, סיכונים גדולים

השליטה המסורתית בקהל נשענת על מצפי-אדם, מחסומים קבועים ונתיבי תנועה מתוכננים בקפידה. אבל עיניו של האדם מתעייפות, וקהל יכול להתנהג באופן לא צפוי. במהלך החג׳, המתפללים נעים בין אתרים קדושים מרכזיים לאורך שבילים, דרכים ורחבות פתוחות שיכולות במהירות להפוך לצווארות בקבוק. המחברים טוענים שכדי לשמור על בטיחות, הרשויות זקוקות לכלים שיכולים לראות את התמונה המלאה בזמן אמת: היכן צפוף, היכן נדיר, וכמה מהר אנשים נכנסים או עוזבים אזור מסוים.

להteach מחשבים לראות אנשים

כדי לבנות כלי כזה, החוקרים משתמשים בשתי שיטות מתקדמות של ראייה ממוחשבת. הראשונה, הנקראת YOLOv4, מאומנת לזהות אנשים בתמונות על ידי שרטוט מסגרות סביב כל אדם, אף במצבים צפופים במיוחד. השנייה, DeepSORT, מקבלת את הגילויים הללו ועוקבת אחר כל אדם לאורך פריימים רבים של הווידאו, ומקצה לכל אחד מזהה בלתי נראה כך שניתן לעקוב אחרי מסלולו לאורך זמן. הצוות אסף אוסף גדול של תמונות ווידאו מהחג׳ של 2019, שנלקחו באזורים שונים סביב הר רפאת. הם תוייגו בזהירות עשרות אלפי ראשים וגופים, סיננו חומר מטושטש, והעשירו את הנתונים עם שינויים קטנים כדי שהמערכת תישאר אמינה בתנאי תאורה, זוויות וצפיפויות שונות.

Figure 1
Figure 1.

מצמתי תנועה לתמונת צפיפות

ברגע שהמערכת מסוגלת למצוא ולעקוב אחר יחידים, היא יכולה להפוך את הנקודות הנעות לתמונה של התנהגות הקהל. על ידי ספירת כמה אנשים נכנסים ויוצאים מאזור מסוים וכמה צפופים הם, המערכת ממיינת את צפיפות הקהל לשלושה מצבים אינטואיטיביים: נמוכה, בינונית וגבוהה. במקום להסתמך על הערכות גסות או דוחות מאוחרים, המנהלים יכולים לראות היכן אנשים מתפזרים באופן חלק והיכן נוצרים צווארי בקבוק קריטיים. מאחר ש-DeepSORT מעוצב להתמודד עם אנשים שחוסמים זה את זה מהתצוגה ונראים דומים מאוד (כמו בביגוד הלבן של רבים מהמתפללים), הוא יכול לשמור על מסלולים יציבים גם בסצינות צפופות ומטעות ויזואלית.

עד כמה המערכת עובדת טוב

המחברים בדקו את המערכת שלהם באופן מקיף. הם השוו כמה גרסאות של משפחת YOLO וכן שיטות מעקב שונות, ובסופו של דבר מצאו ש-YOLOv4 בשילוב עם DeepSORT נתן את הביצועים הטובים ביותר על הקלטות אמיתיות מהחג׳. לאחר כוונון המודלים ואימון על מאגר הנתונים המוטה, YOLOv4 זיהה אנשים בדיוק של מעל 95% ובאיזון גבוה מאוד בין גילויי-חסרים לאזהרות שווא. DeepSORT עקב אחר יחידים בדיוק של יותר מ-91%, ושחזר מסלולים גם כשהם הוסתרו באופן זמני מאחורי אחרים. בהשוואה למערכות דומות המשמשות לתנועה, ניטור ריחוק חברתי או סצינות קהל אחרות, הגישה המותאמת לחג׳ תאמה או עלתה על התוצאות הטובות ביותר שדווחו, תוך עבודה באחד הסביבות המאתגרות ביותר.

Figure 2
Figure 2.

מה זה יכול להשפיע בשטח

בעשייה מעשית, מערכת כזו יכולה לפעול מאחורי מצלמות מעקב קיימות ולנטר ברציפות את תנועת המתפללים. כאשר מספר האנשים בשביל מתקרב למגבלת הבטיחות שלו, או כשכיכר מתחילה למלא באי-שוויון, התוכנה תוכל להתריע בפני הרשויות להכווין מחסומים, להסיט זרמים או לשלוח הודעות למתנדבים בשטח. מעבר לבטיחות, התובנות הללו יכולות לשפר היכן למקם צוותים רפואיים, שירותים וקישורי הובלה, ולעזור למתכננים לעצב מחדש נתיבי תנועה לעונות הבאות על בסיס נתונים אמיתיים במקום הערכות. המחברים מציינים גם שהגישה יכולה לסייע באירועי ספורט גדולים, קונצרטים או פסטיבלים.

דרך חכמה ובטוחה יותר להנחות את ההמונים

עבור הקורא הלא מקצועי, המסקנה המרכזית פשוטה: מחשבים יכולים כיום לצפות בקהלים אדירים ביתר זהירות ועקביות מאשר כל צוות אנושי, ולהפוך וידאו גולמי לאזהרות מוקדמות והדרכה מעשית. על ידי שילוב זיהוי ומעקב אנשים במערכת איתנה אחת, מחקר זה מראה שניתן לנטר את זרם מיליוני המתפללים בזמן אמת, לסווג את רמת הצפיפות בכל אזור ולפעול לפני שהמצב יהפוך למסוכן. אם יפותחו ויופעלו באחריות, כלים כאלה יכולים להפוך כינוסים דתיים גדולים ואירועים המוניים אחרים לבטוחים, חלקים ופחות מתוחים עבור כל המעורבים.

ציטוט: Aljojo, N., Ardah, H., Alamri, A. et al. Predicting congregational and crowd spread-out flow using YOLOv4 and DeepSORT. Sci Rep 16, 13869 (2026). https://doi.org/10.1038/s41598-026-44719-7

מילות מפתח: ניהול קהל, ראייה ממוחשבת, בטיחות בחג׳, מעקב עצמים, למידה עמוקה