Clear Sky Science · ar
بروتوكول استجابة الطوارئ الشامل لحوادث الأنفاق معزَّز بالتعلُّم المعزَّز
لماذا تهم عمليات الإنقاذ الأذكى في الأنفاق
عندما تضرب الكارثة نفقًا بريًا—سواء ناجمة عن تصادم أو حريق أو انهيار هيكلي—قد يجد الناس أنفسهم محاصَرين داخل أنبوب طويل مملوء بالدخان يشبه المتاهة وله مخارج قليلة جدًا. على فرق الإنقاذ البشرية أن تندفع إلى الداخل تمامًا مع تدهور الرؤية وارتفاع درجات الحرارة وحجب الحطام للطريق. تستكشف هذه الدراسة كيف يمكن أن تصبح روبوتات طائرة صغيرة، أو طائرات بدون طيار، موجهة باستراتيجية تعلم ذكية، مساعدين سريعين وموثوقين في هذه المواقف الخطرة، تعثر على الضحايا وتحدد مسارات آمنة بينما تبقي فرق البشر بعيدًا عن أخطر المخاطر.

عنق زجاجة خطير تحت الأرض
تعتمد المدن الحديثة على الأنفاق للطرق السريعة والقطارات والمرافق، لكن التصميم المغلق نفسه الذي يجعلها فعالة يجعل الحوادث داخلها قاتلة على نحو غير عادي. تنتشر الحرائق الدخان بسرعة، وتتراكم الغازات السامة، ويمكن أن تنسد الممرات الضيقة بمركبات متصادمة أو خرسانة متساقطة. كثيرًا ما تدخل فرق الإنقاذ التقليدية وهي تملك معلومات محدودة، تخمن وجهتها بينما تكافح أجهزة الراديو للعمل عبر الصخور والخرسانة الكثيفة. أظهرت كوارث سابقة في الصين واليابان، من بين دول أخرى، مدى صعوبة الوصول إلى الضحايا في الوقت المناسب، مما يبرز الحاجة إلى أدوات قادرة على الرؤية والتفكير مقدمًا بطرق لا يستطيعها البشر.
تعليم الطائرات بدون طيار على الاستكشاف والبحث
يقترح المؤلفون نظامًا تعمل فيه عدة طائرات بدون طيار مستقلة معًا لاستكشاف نفق تالف، وبناء خريطة حية، وتحديد أماكن المحاصرين. بدلًا من اتباع مسار ثابت مبرمج مسبقًا، يتعلم كل طائرة من تجاربه باستخدام طريقة تُسمى التعلُّم المعزَّز: يجرب إجراءات، يرى ما يحدث، ويكتشف تدريجيًا أي الخيارات تميل إلى أن تؤدي إلى إنقاذ أسرع وأخطاء أقل. يُمثَّل النفق كشبكة من الخلايا، وتركز الطائرات على «الحدود» حيث يلتقي الفضاء المعروف بالفضاء المجهول، دافعةً ذلك الحد تدريجيًا إلى الخارج. في كل خطوة، تختار من بين مجموعة صغيرة من حركات الشبكة، محدثةً جداول داخلية عن الحركات التي نجحت أكثر في مواقف مشابهة من قبل.

جعل العديد من الروبوتات تتعاون من دون ثرثرة
يثير جعل عدة طائرات تبحث نفس النفق في وقت واحد تحديًا جديدًا: كيف تتجنّب الاصطدام ببعضها أو إعادة مسح نفس المنطقة مرارًا، خاصة عندما قد تكون الاتصالات غير موثوقة؟ بدلًا من تزويدها بزعيم مركزي أو بث راديوي مستمر، صمّم الباحثون نظام نقاط بسيطًا يشجع سلوك المجموعة الجيد بهدوء. تكسب الطائرة مكافأة كبيرة عندما تكتشف ضحية جديدة، لكن تُعاقب إذا أهدرت الوقت في إعادة زيارة نفس المكان، أو اصطدمت بطائرة أخرى، أو «فشلت» نتيجة نفاد بطاريتها. مع الوقت، يدفع هذا كل طائرة إلى تفضيل المناطق غير المستكشفة والابتعاد عن زميلاتها، فتنبثق نوع من التعاون طبيعيًا من العواقب المشتركة، رغم أن كل طائرة تتعلم تقنيًا بمفردها.
استعارة حيل من الذئاب لتجنُّب الوقوع في مأزق
قد يعلق التعلُّم القائم على التجربة والخطأ أحيانًا في عادات آمنة لكنها دون المستوى الأمثل—مثل اختيار ممر مألوف دائمًا بدل تجربة اختصار محفوف بالمخاطرة. للحفاظ على فضول الطائرات، يستعير الفريق أفكارًا من نموذج رياضي لطريقة صيد الذئاب الرمادية في الأسراب. هذا المكوّن من «تحسين الذئب الرمادي» يدفع الطائرات أحيانًا إلى تقليد أنماط البحث الأكثر أداءً التي شوهدت حتى الآن، مع ترك مجال للاستكشاف. عمليًا، يشكل هذا أي الأفعال الجديدة التي تُجرب، مساعِدًا عملية التعلُّم على القفز خارج الطرق المسدودة والتكيف عندما يتغير النفق—على سبيل المثال، إذا انقطع جزء من المسار فجأة بسبب حريق أو حطام.
اختبار النهج في كوارث افتراضية
لأنه ليس من الآمن اختبار استراتيجيات غير مثبتة في أنفاق الطوارئ الحقيقية، بنى الباحثون محاكيات حاسوبية مفصّلة تحاكي الممرات الضيقة والنهايات المسدودة والعقبات والضحايا المتناثرين. يقارنون نظامهم القائم على التعلُّم بعدة طرق أخرى، بما في ذلك التجوال العشوائي البحت والتحسين المنفرد دون تعلم. عبر اختبارات ذات طائرة واحدة ومتعددة الطائرات، يجد نهجهم الضحايا بشكل أسرع، ويستكشف المزيد من النفق مع خطوات مهدورة أقل، ويتجنّب الاصطدامات بموثوقية أكبر. والأهم من ذلك، أنه يفعل ذلك باستخدام حسابات خفيفة قائمة على الجداول بدل شبكات تعلم عميق مستهلكة للطاقة، مما يعني أنه يمكن تشغيله عمليًا على حواسيب صغيرة محمولة على الطائرات خلال حالة طوارئ فعلية.
ما الذي قد يعنيه هذا لعمليات الإنقاذ المستقبلية
تُظهر الدراسة أن أسرابًا من الطائرات البسيطة نسبيًا، موجهة بقواعد تعلم مُصمَّمة بعناية وبعض الأفكار المستعارة من الطبيعة، يمكن أن تصبح شركاء ذوي قيمة لرجال الإطفاء وفرق الإنقاذ في كوارث الأنفاق. من خلال رسم خرائط سريعة للبيئات المليئة بالدخان والمتغيرة والتركيز على مواقع الضحايا المحتملة دون تحكم بشري مستمر، قد تقلل هذه الأنظمة دقائق ثمينة من أوقات الاستجابة بينما تخفض المخاطر التي يواجهها المستجيبون الأوائل. رغم أن العمل حتى الآن قائم على محاكاة وأجهزة استشعار مثالية، فإنه يمهّد أساسًا عمليًا لأنظمة مستقبلية في العالم الحقيقي يجب أن تعمل ضمن حدود ضيقة للوقت والطاقة والحوسبة في بعض أكثر بيئات الإنقاذ تحديًا على الأرض.
الاستشهاد: ur Rehman, H.M.R., Gul, M.J., Younas, R. et al. End-to-end emergency response protocol for tunnel accidents augmentation with reinforcement learning. Sci Rep 16, 6226 (2026). https://doi.org/10.1038/s41598-026-37191-w
الكلمات المفتاحية: استجابة الطوارئ في الأنفاق, طائرات بدون طيار للبحث والإنقاذ, التعلُّم المعزَّز المتعدد الوكلاء, إدارة الكوارث بالروبوتات, الاستكشاف الذاتي