Clear Sky Science · ar

إطار عمل قابل للتفسير للتعلم المعزز متعدد الوكلاء للاتصال الآمن والتكيفي في أسراب الطائرات بدون طيار القائمة على FANETs

· العودة إلى الفهرس

فرق طائراتٍ بدون طيار أكثر ذكاءً للمواقف الصعبة

تخيل فريقًا من الطائرات بدون طيار يتجه بسرعة نحو حريق هائل، أو منطقة فيضان، أو مهمة بحث وإنقاذ. يجب أن يتبادلوا المعلومات فورًا، ويتفادوا مهاجمين يحاولون تشويش أو خداع أنظمتهم، وفي الوقت نفسه يشرحوا للمشغلين البشر سبب اختيارهم مسارًا معينًا بدلًا من آخر. تقدم هذه الورقة طريقة جديدة لجعل مثل هذه الأسراب أكثر أمانًا وقابلية للفهم، لزيادة ثقة الناس بها في مواقف حياة أو موت.

لماذا تحتاج أسراب الطائرات إلى أكثر من واي‑فاي سريع

لا تطير الطائرات في السرب فحسب؛ بل تتواصل باستمرار، تنقل خرائط وقراءات المستشعرات وتنبيهات من طائرة إلى أخرى. هذا النوع من الشبكات الجوية، المسمى شبكة طيارية مؤقتة (flying ad hoc network)، سريع ومرن لكنه هش أيضًا. تنتقل الإشارات في الهواء المفتوح، وتحرك الطائرات بسرعة، ولا يوجد برج مركزي مسؤول. هذا يجعل الشبكة هدفًا سهلاً لهجمات رقمية مثل حجب الإشارات، وانتحال الهويات، أو إسقاط الرسائل بصمت. غالبًا ما تعتمد أدوات الأمان الحالية على خوادم مركزية بطيئة أو خوارزميات «صندوق أسود» غامضة، وهو أمر محفوف بالمخاطر عندما تكون الأرواح أو الممتلكات أو البنية التحتية الحرجة على المحك.

تعليم كل طائرة كيف تتعلم وتقرر

يقترح المؤلفون إطار عمل للتعلم المعزز متعدد الوكلاء القابل للتفسير—EMARL‑XAI—يجعل كل طائرة وكيلاً متعلمًا. بدلًا من اتباع قواعد ثابتة، تراقب كل طائرة موقعها وجودة الإشارة ومستوى البطارية ومدى مصداقية جيرانها. باستخدام طريقة تعلم تعاونية، يكتشف السرب تدريجيًا أي مسارات الاتصال توصل الرسائل بشكل موثوق، وتتفادى الطائرات المشبوهة، وتوفر الطاقة. تنبثق قرارات مثل «من يجب أن يعيد توجيه الحزمة التالية؟» من الخبرة بدلاً من أن تكون مشفرة بشكل ثابت. والأهم من ذلك ألا يوجد عقدة رئيسية واحدة: الطائرات تتعلم وتتصرف بطريقة لامركزية، ما يناسب الأجواء المتغيرة السريعة والعدائية بشكل أفضل.

Figure 1
الشكل 1.

كشف الجهات الخبيثة والبقاء متصلين

يُدمَج الأمان مباشرة في طريقة تعلم السرب. تحتفظ كل طائرة بـ «تقدير ثقة» متجدد تجاه الطائرات القريبة، استنادًا إلى ما إذا كانت تعيد توجيه الرسائل، وتتصرف باستقرار، أو تُظهر علامات هجوم، مثل إسقاط معظم الحزم أو التصرف كعدد كبير من الهويات المزيفة في وقت واحد. تؤثر درجات الثقة هذه في الاختيارات المستقبلية: تُفضَّل الجيران الموثوق بهم كوسطاء، بينما يتم تفادي المشبوهين تدريجيًا وعزلهم فعليًا. تم اختبار الإطار ضد مجموعة من التهديدات الواقعية—التشويش، وانتحال الهوية، وهجمات سِبيل، والثقوب السوداء—داخل محاكاة مفصلة تربط محاكي شبكة (لروابط الراديو والتداخل) مع محاكي طيران الطائرات (للحركة في فضاء ثنائي وثلاثي الأبعاد).

جعل اختيارات الطائرات مفهومة

بعيدًا عن الأداء الخام، صُمم النظام ليشرح نفسه. تستخدم وحدة القابلية للتفسير أدوات معروفة من الذكاء الاصطناعي الحديث لتبيان العوامل التي أثرت أكثر على القرار. على سبيل المثال، تصنف طريقة تُدعى SHAP المدخلات مثل الثقة أو قوة الإشارة بحسب تأثيرها على مسار مختار، بينما تبني طريقة أخرى تُسمى LIME نماذج محلية بسيطة لنماذج «ماذا لو» حول قرارات محددة. تسلط خرائط الانتباه البصري الضوء على الأنماط في السلوك الأخير التي ركز عليها نظام التعلم. مجتمعة، تتيح هذه العروض للمشغلين البشريين رؤية، على سبيل المثال، أن طائرةً تجنبت جارًا معينًا أساسًا لأن سلوكها السابق في إعادة التوجيه بدا مشبوهًا، وليس بسبب هبوط مؤقت في قوة الإشارة. يحول هذا شبكة معقدة من حسابات الشبكات العصبية إلى قصة يمكن تتبعها.

كيف يؤدي النهج الجديد في السماء الافتراضية

يواجه الباحثون EMARL‑XAI بأساليب توجيه تقليدية وأنظمة قائمة على التعلم أكثر تحفظًا. في مهام محاكاة تضم حتى 75 طائرة ويمثل حتى 30% منها سلوكًا خبيثًا، يقدم الإطار الجديد نسبة أعلى من الحزم الموصلة، ويقلل التأخيرات، ويحافظ على معدل اتهام الطائرات الشريفة بالخطأ منخفضًا إلى حد معقول. كما يتعلم استراتيجيات مستقرة أسرع من نظام تعلم متعدد الوكلاء مشابه بدون ثقة أو أدوات تفسير، ويستهلك طاقة أقل لكل توصيل ناجح مقارنة بالأساليب التقليدية. عندما يزيل المؤلفون أجزاء من التصميم بشكل منهجي، يتراجع الأداء: يؤدي حذف مكون الثقة إلى زيادة حادة في الأخطاء حول من هو خبيث، بينما يؤدي حذف أدوات القابلية للتفسير إلى بقاء الدقة إلى حد كبير لكنها يُحدث هبوطًا حادًا في ثقة المقيمين البشر.

Figure 2
الشكل 2.

ما الذي يعنيه هذا لمهام الطائرات الحقيقية

لغير المتخصص، الاستنتاج الرئيسي هو أن هذا العمل يقرب أسراب الطائرات بدون طيار من كونها زملاء فريق موثوقين بدلًا من أجهزة غامضة وهشة. يوضح EMARL‑XAI كيف يمكن للطائرات أن تتعلم بنفسها توجيه الرسائل بأمان عبر بيئة متغيرة وعدائية، مع ترك أثر واضح يمكن قراءته بشريًا يشرح سبب أفعالها. رغم أن الدراسة مبنية على محاكاة وتحتاج لاختبارات على أجهزة فعلية، فإنها ترسم طريقًا نحو أسراب طائرات ليست فقط أكثر ذكاءً وأمنًا، بل أيضًا مسؤولة—وهو خطوة أساسية إذا توقعنا أن تساعد في إدارة الكوارث، أو مراقبة المدن، أو حماية البنية التحتية الحيوية.

الاستشهاد: Alkahtani, H.K., Galiya, Y., Akbayan, B. et al. Explainable multi agent reinforcement learning framework for secure and adaptive communication in UAV swarm based fanets. Sci Rep 16, 11830 (2026). https://doi.org/10.1038/s41598-026-39366-x

الكلمات المفتاحية: سرب الطائرات بدون طيار, الاتصال الآمن, التعلم المعزز متعدد الوكلاء, الذكاء الاصطناعي القابل للتفسير, أمن الشبكات اللاسلكية