Clear Sky Science · ar

QPSODRL: بروتوكول تجميع وتوجيه ذكي محسّن قائم على تحسين الجسيمات الكمومية والتعلّم المعزّز العميق لشبكات المستشعرات اللاسلكية

2026-01-16 · العودة إلى الفهرس

شبكات مستشعرات أذكى لعالم مترابط

من الزراعة الدقيقة إلى أنظمة الإنذار من الكوارث، تراقب شبكات المستشعرات اللاسلكية عالمنا بهدوء، جامعَةً بياناتٍ من مئات أو آلاف الأجهزة الصغيرة المنتشرة على مساحات واسعة. أضعف نقاطها هي أيضاً ما يعرّفها: كل مستشعر يعمل ببطارية صغيرة يصعب أو يستحيل استبدالها. تقدم هذه الورقة طريقة جديدة لتنظيم وتوجيه تدفّق البيانات في هذه الشبكات بحيث تدوم البطاريات لفترة أطول، وتسافر المعلومات بشكل أكثر موثوقية، ويتكيف الشبك عند تغير الظروف.

لماذا تحتاج الأجهزة الصغيرة إلى ذكاء كبير

في شبكة المستشعرات اللاسلكية، يستطيع كل عقدة الاستشعار والحوسبة والاتصال، لكن الطاقة ثمينة. إذا قامت بعض العقد بالكثير من العمل، تموت مبكراً، مخلّفة "مناطق ميتة" لا تُجمع منها بيانات. لتجنب ذلك، يقوم المصممون عادة بتجميع العقد إلى عناقيد. داخل كل عنقود، تصبح عقدة واحدة رأس العنقود: تجمع القراءات من جيرانها وتعيد توجيهها نحو محطة قاعدة مركزية. اختيار العقد التي يجب أن تكون رؤوس عنقود، وكيف يجب أن تقفز البيانات عبر الشبكة، هو لغز معقّد يتغير مع نفاد البطاريات. الحلول التقليدية القائمة على قواعد أو خوارزمية واحدة غالباً ما تستقر بسرعة على أنماط دون المثلى أو تفشل عندما تتطور شكل الشبكة ومستويات الطاقة بمرور الوقت.

مزج أسراب مستوحاة من الكمّ مع آلات التعلم

تقدم هذه الدراسة QPSODRL، بروتوكولاً يجمع بين فكرتين قويتين: طريقة سرب مستوحاة من الكمّ لتشكيل العناقيد ومحرك تعلّم معزّز عميق للتوجيه. في المرحلة الأولى، تستكشف "جسيمات" افتراضية طرقاً مختلفة لتعيين رؤوس وأعضاء العناقيد. يوجّه سلوكها مقياس مدى توازن توزيع الطاقة عبر الشبكة، المعروف بالانتروبيا. عندما يكون استخدام الطاقة غير متوازن، يشجع الخوارزم الاستكشاف الواسع لتخطيطات عنقود جديدة؛ وعندما تبدو الأمور مستقرة، يقوم بضبط الترتيبات الواعدة بدقة. خطوة خاصة من "الاضطراب النخبوي" تدفع أحياناً أفضل المرشحين في اتجاهات جديدة، مما يساعد البحث على الهروب من الحلول المحلية الراكدة وتجنّب استنزاف نفس العقد عالية الطاقة.

تعليم الشبكة لاكتشاف مسارات أفضل

بعد تشكيل العناقيد، تقرر المرحلة الثانية كيف يجب على كل رأس عنقود إرسال بياناته إلى محطة القاعدة. بدلاً من اتباع مسارات ثابتة، يعامل QPSODRL كل رأس عنقود كوكيل في عملية تعلّم. في كل خطوة، يلاحظ الوكيل طاقته المتبقية، وطاقة ومسافة الرؤوس المجاورة، والتأخيرات المقدّرة، ثم يختار القفزة التالية. شكل متخصص من التعلّم العميق Q، يُسمى شبكة Q العميقة المزدوجة المتصارعة (Dueling Double Deep Q‑Network)، يُقدّر جودة كل خيار على المدى الطويل. يضيف المؤلفون مصطلح "الانتروبيا" لتثبيط تحول النظام إلى ثقة مفرطة بسرعة، بحيث يستمر في استكشاف المسارات البديلة. كما يصممون آلية إعادة تشغيل تجربة محسنة تركز عمداً على أكثر الحالات إفادة في التعلّم — مثل عندما تكون الطاقة منخفضة أو تزداد التأخيرات — حتى يتحسّن النموذج أسرع في السيناريوهات الأكثر أهمية.

وضع النهج تحت الاختبار

لفحص أداء QPSODRL، يجري المؤلف محاكاة حاسوبية مفصَّلة لشبكات تضم 100 و200 عقدة منتشرة على مساحات بأحجام مختلفة ومع نسب مختلفة من العقد التي تعمل كرؤوس عنقود. يُقارن البروتوكول الجديد بأربعة منافسين حديثين ومتقدّمين يستخدمون أسراب الجسيمات، تحسين الحيتان، المنطق الضبابي، أو مخططات هجينة وقائمة على التعلم. تحت جميع الإعدادات المختبرة، يحافظ QPSODRL على الشبكة حية لعدد أكبر من جولات الاتصال، ويسلم حزم بيانات أكثر إلى محطة القاعدة، ويستهلك طاقة كلية أقل. كما يوزع عبء العمل بين رؤوس العناقيد بشكل أكثر توازناً، كما يتضح من انخفاض التباين في مقدار حركة المرور التي يتعامل معها كل رأس. وتظهر هذه المكاسب بشكل خاص في التوزيعات الأصعب حيث توضع محطة القاعدة عند حافة الحقل، مما يفرض قفزات أطول لبعض العقد.

ماذا يعني هذا للأنظمة الواقعية

لغير المتخصّصين، الرسالة الأساسية هي أن منح شبكات المستشعرات القدرة على تحسين بنية الشبكة على مستوى شامل والتعلّم محلياً من التجربة يمكن أن يطيل مدة عملها المفيد بشكل كبير. يجلب تجميع QPSODRL المستوحى من الكمّ توازناً في استخدام الطاقة، في حين يتكيف توجيهه القائم على التعلم العميق مع الظروف المتغيرة دون ضبط بشري مستمر. رغم أن النتائج مبنية على محاكاة مع عقد ثابتة غير متحركة، فإنها توحي بأن نشرات المستشعرات المستقبلية — من المدن الذكية إلى مراصد البيئة — قد تعمل أطول، وتفشل أقل، وتستغل طاقة البطاريات المحدودة بشكل أفضل باعتماد استراتيجيات تحكم ذكية مماثلة.

الاستشهاد: Guangjie, L. QPSODRL: an improved quantum particle swarm optimization and deep reinforcement learning based intelligent clustering and routing protocol for wireless sensor networks. Sci Rep 16, 5526 (2026). https://doi.org/10.1038/s41598-026-35365-0

الكلمات المفتاحية: شبكات المستشعرات اللاسلكية, توجيه موفّر للطاقة, التعلّم المعزّز العميق, تحسين التجمعات السربية, تجميع الشبكات