Clear Sky Science · he

פרוטוקול תגובה חירום מקצה־אל־קצה למקרי תאונות במנהרות משודרג באמצעות למידה בחיזוק

· חזרה לאינדקס

מדוע חילוצים חכמים במנהרות חשובים

כאשר אסון מתרחש בתוך מנהרת דרך—בין אם עקב תאונה, אש או קריסה מבנית—אנשים עלולים להיתקע בתוך צינור ארוך ומעורפל עם מעשן מועט ומעט יציאות. המצילים האנושיים נאלצים להיכנס במהירות בדיוק כשהראות יורדת, הטמפרטורות עולות וההריסות חוסמות את הדרך. המחקר הזה בוחן כיצד רובוטים מעופפים קטנים, או רחפנים, המונחים על‑ידי אסטרטגיית למידה מתוחכמת, יכולים להפוך לעוזרים מהירים ואמינים במצבים מסוכנים אלה, לאתר נפגעים ולמפות דרכים בטוחות תוך שמירה על צוותי האדם מחוץ לאזורים המסוכנים ביותר.

Figure 1
Figure 1.

צווארי בקבוק תת־קרקעיים מסוכנים

ערים מודרניות מסתמכות על מנהרות לכבישים, לרכבות ולתשתיות, אך העיצוב הסגור שהופך אותן ליעילות גם עושה תאונות בתוכן במיוחד קטלניות. אש מפיצה עשן במהירות, גזים רעילים מצטברים ומעברים צרים עלולים להסתם ברכבים התרסקו או בבטון שנפל. צוותי חילוץ מסורתיים נכנסים לעתים קרובות עם מידע מוגבל, מהם צריכים לנחש לאן לפנות בזמן שהרדיו שלהם מתקשה לפעול דרך סלע ובטון עבים. אסונות בעבר בסין וביפן, בין השאר, הראו עד כמה קשה להגיע אל הנפגעים בזמן, מה שמדגיש את הצורך בכלים שיכולים לראות ולחשוב קדימה בדרכים שבני אדם אינם יכולים.

להכשיר רחפנים לחקירה ולחיפוש

המחברים מציעים מערכת שבה מספר רחפנים אוטונומיים עובדים יחד כדי לחקור מנהרה פגועה, לבנות מפה חיה ולמ localizar אותם הנלכדים. במקום ללכת לפי מסלול קבוע ומתוכנת מראש, כל רחפן לומד מהניסיון באמצעות שיטה הנקראת למידת חיזוק: הוא מנסה פעולות, צופה בתוצאות ובהדרגה מגלה אילו בחירות נוטות להוביל לחילוצים מהירים יותר ופחות טעויות. המנהרה מיוצגת כרשת של תאים, והרכפנים מתמקדים ב"חזיתות" שבהן המרחב הידוע פוגש את הבלתי‑ידוע, ודוחפים את הגבול ההכרה החוצה בהדרגה. בכל שלב הם בוחרים מתוך סט קטן של תנועות ברשת, ומעדכנים טבלאות פנימיות אילו מהלכים עבדו היטב במצבים דומים בעבר.

Figure 2
Figure 2.

להביא הרבה רובוטים לשתף פעולה בלי שיחה רבתי

גרימת מספר רחפנים לחפש את אותה מנהרה בו‑זמנית מעלה אתגר חדש: כיצד הם נמנעים להתנגש זה בזה או לסרוק שוב ושוב את אותו אזור, במיוחד כאשר התקשורת עלולה להיות לא אמינה? במקום לתת להם בוס מרכזי או שיחת רדיו מתמדת, החוקרים מעצבים מערכת ניקוד פשוטה שמעודדת באופן שקט התנהגות קבוצתית טובה. רחפן מרוויח פרס גדול כאשר הוא מגלה נפגע חדש, אך הוא נענש אם הוא מבזבז זמן בביקור חוזר באותו מקום, מתנגש עם רחפן אחר או "נכשל" עקב התרוקנות הסוללה. עם הזמן זה דוחף כל רחפן להעדיף אזורים בלתי מגולים ולהתרחק מעמיתיו, כך סוג של שיתוף פעולה צומח באופן טבעי מהתוצאות המשותפות, אף על פי שכל אחד טכנית לומד בנפרד.

השאלה תחבולות מזאיים כדי להימנע מהסתבכות

למידה טהורה של ניסוי וטעייה עלולה לפעמים להיתקע בהרגלים בטוחים אך לא אופטימליים—כמו תמיד לבחור במסדרון מוכר במקום לנסות קיצור דרך מסוכן. כדי לשמור על הסקרנות של הרחפנים, הצוות שאב רעיונות ממודל מתמטי של אופן הציד של זאבים אפורים בלהקה. רכיב "אופטימיזציית הזאב האפור" הזה מבסס את הרחפנים לחקות מדי פעם את דפוסי החיפוש בעלי הביצועים הטובים ביותר שנראו עד כה, תוך שמירה על מקום לחקירה. בפועל, הוא מעצב אילו פעולות חדשות נבדקות, ועוזר לתהליך הלמידה לצאת ממבוי סתום ולהסתגל כשהמנהרה משתנה—למשל אם חלק מהמסלול נחסם פתאום על‑ידי אש או הריסות.

בדיקת הגישה באסונות וירטואליים

מכיוון שאינו בטוח לבדוק אסטרטגיות בלתי נשענות במנהרות חירום אמיתיות, החוקרים בנו סימולציות מחשב מפורטות המדמות מעברים צרים, סופים ללא מוצא, מכשולים ונפגעים מפוזרים. הם משווים את המערכת המבוססת למידה שלהם מול מספר שיטות אחרות, כולל שוטטות אקראית טהורה ואופטימיזציה עצמאית ללא למידה. הן במבחנים עם רחפן יחיד והן בריבוי‑רחפנים, הגישה שלהם מוצאת נפגעים מהר יותר, חוקרת יותר מהמנהרה עם פחות צעדים מבוזבזים וממנעת התנגשויות בצורה אמינה יותר. חשוב מזה, היא עושה זאת באמצעות חישובים קלים מבוססי טבלאות במקום רשתות למידה עמוקה צורכות־אנרגיה, כלומר סביר להפעיל אותה על מחשבים מוטמעים קטנים בזמן חירום אמיתי.

מה זה עלול להביא לחילוצים בעתיד

המחקר מראה שנחילים של רחפנים פשוטים יחסית, המונחים על‑ידי כללי למידה מתוכננים היטב ומספר רעיונות שאובו מהטבע, יכולים להפוך לשותפים בעלי ערך לכבאים וצוותי חילוץ באסונות במנהרות. על‑ידי מיפוי מהיר של סביבות מעושנות ומשתנות ובחינת מיקומי נפגעים סבירים ללא שליטה אנושית מתמדת, מערכות כאלה יכולות לחסוך דקות יקרות בזמני התגובה תוך הפחתת הסיכונים שחווים המגיבים הראשונים. אף על פי שהעבודה עד כה מבוססת על סימולציות וחיישנים אידיאליים, היא מניחה יסוד מעשי למערכות עתידיות בעולם האמיתי שיצטרכו לפעול תחת מגבלות חזקות של זמן, אנרגיה ומחשוב באחד מסביבי החילוץ המאתגרים ביותר על פני כדור הארץ.

ציטוט: ur Rehman, H.M.R., Gul, M.J., Younas, R. et al. End-to-end emergency response protocol for tunnel accidents augmentation with reinforcement learning. Sci Rep 16, 6226 (2026). https://doi.org/10.1038/s41598-026-37191-w

מילות מפתח: תגובה חירום במנהרות, רחפנים לחיפוש והצלה, למידת חיזוק רב־סוכנית, ניהול אסונות רובוטי, חקירה אוטונומית