Clear Sky Science · ar

تحسين الطاقة المدعوم بـ DQN لشبكات الاتصالات ذات الطاقة اللاسلكية

· العودة إلى الفهرس

تغذية الأجهزة الصغيرة عبر الهواء

من أعمدة الإنارة الذكية إلى أجهزة إنذار الحريق المخبأة في الغابات، تشكل الآن أعداد لا تُحصى من الأجهزة الصغيرة شبكة إنترنت الأشياء. الحفاظ على تزويد كل هذه الأجهزة بالطاقة يمثل مشكلة كبيرة: البطاريات تنفد، وتمديد أسلاك الطاقة في كل مكان غير عملي. تستعرض هذه الورقة طريقة لإرسال الطاقة لاسلكياً إلى مثل هذه الأجهزة واستخدام الذكاء الاصطناعي لتوزيع تلك الطاقة بحكمة، بحيث تبقى الحواس الحرجة تعمل لفترة أطول ويعمل الشبك ككل بسلاسة أكبر.

لماذا تحتاج الطاقة اللاسلكية إلى تحكم أذكى

تبث شبكات الاتصالات ذات الطاقة اللاسلكية موجات راديوية يمكن للأجهزة تحويلها إلى كهرباء بينما تستخدمها أيضاً لنقل البيانات. في معظم الدراسات السابقة، اعتُبر تحويل الطاقة سلوكاً خطياً بسيطاً: إشارة أقوى تعني طاقة أعظم بشكل متناسب. في الواقع، تبدأ دوائر حصاد الطاقة في «التسطح» عندما تكون الإشارة الواردة قوية، فتضيع جزءاً من الطاقة. وفي الوقت نفسه، تكون البيئات الحقيقية فوضوية: الضوء الشمسي للألواح يتقلب صعوداً وهبوطاً، المباني تحجب الإشارات، والأحداث المفاجئة مثل الحرائق قد تخلق احتياجات بيانات عاجلة عند عقد محددة. القواعد الثابتة التي تتجاهل هذه التقلبات قد تترك بعض الحواس محرومة من الطاقة وتتسبب في إهدار أخرى لها، مما يقصر عمر الشبكة الإجمالي.

عقل متعلم لشبكة الطاقة

لمعالجة ذلك، يصمم المؤلفون متحكماً مبنياً على التعلم يستخدم تقنية تُسمى الشبكات العصبية العميقة Q (Deep Q-Networks)، وهي شكل من أشكال التعلم التعزيزي. بدلاً من الاعتماد على صيغ رياضية جامدة، يعامل هذا المتحكم الشبكة كلعبة تلعب عبر الزمن. في كل جولة يلاحظ الطاقة المتبقية في كل عقدة، وجودة روابط الراديو، ومدى إلحاح كل مهمة — على سبيل المثال مراقبة الحرائق مقابل فحوصات درجة الحرارة الروتينية. استناداً إلى هذه الملاحظات يقرر مقدار الطاقة التي يُرسِلها إلى كل عقدة. بعد كل قرار يتلقى تغذية راجعة تمزج عدة أهداف: إرسال أكبر قدر ممكن من البيانات المفيدة، ومشاركة الطاقة بعدالة بحيث لا تُهمَل أي جهاز باستمرار، وتجنب الإفراط في استخدام مصدر الطاقة المشترك. عبر العديد من الجولات يتعلم المتحكم أي أنماط مشاركة الطاقة تؤدي إلى أفضل أداء طويل الأمد.

Figure 1
الشكل 1.

التنبؤ والتوازن بين الأهداف المتعارضة

أحد المكونات الأساسية في الإطار هو التنبؤ. يستخدم النظام طريقة إحصائية تُسمى الانحدار بعملية غاوسية (Gaussian Process Regression) لتوقع مقدار الطاقة التي من المرجح أن تحصدها العقد في المستقبل القريب، على سبيل المثال مع تغير ظروف الضوء الشمسي. كما يستخدم نموذجاً مرناً لكيفية تلاشي وانعكاس إشارات الراديو في بيئات تشبه المدن الواقعية. تُغذي هذه العناصر عملية اتخاذ القرار التي تتجدد كل بضع ثوانٍ، مما يتيح للمتحكم الاستجابة بسرعة عندما تتغير ظروف الشبكة. إشارة المكافأة التي توجه التعلم تمزج ثلاث أفكار بسيطة: الكفاءة (كم عدد بتات المعلومات التي تُنقل لكل وحدة طاقة)، والعدالة (مدى توزيع الطاقة بالتساوي عبر العقد)، والأولوية (التأكد من أن المهام ذات الإلحاح العالي تحصل على ما تحتاجه). عبر ضبط الأهمية النسبية لهذه المكونات الثلاثة، يمكن لمشغلي الشبكة الاختيار بين أقصى مدة تشغيل، عدالة صارمة، أو معدلات بيانات قصوى.

ماذا تكشف المحاكاة

نظرًا لأن التجارب الحقيقية لا تزال جارية، يقيم المؤلفون طريقتهم في محاكيات حاسوبية مفصلة لشبكة تضم 30 جهازاً مزوداً بالطاقة لاسلكياً، ويستكشفون أيضاً سيناريوهات تصل إلى 100 عقدة. بالمقارنة مع تقسيم ثابت بسيط للطاقة وطريقة تعلم تقليدية أكثر، يحافظ المتحكم الجديد على تشغيل الشبكة لفترة أطول بكثير — حوالي نصف عدد الجولات مرة أخرى قبل أن تنطفئ العقد. كما يُبقي تشتت مستويات الطاقة بين الأجهزة أقل بكثير، مما يعني بقع «ميتة» أقل حيث تفشل العقد مبكراً. تستجيب الاستراتيجية المتعلمة أسرع عدة مرات للتغيرات المفاجئة، مثل هبوط في جودة الإشارة أو قفزة في إلحاح المهمة، وتحافظ على معدل نقل بيانات أعلى عبر مجموعة واسعة من ظروف الراديو. ومن المهم أن المؤلفين يولون اهتماماً للتفاصيل العملية، مبينين أن نسخة مدمجة من نموذج التعلم يمكن أن تعمل على متحكمات دقيقة منخفضة التكلفة مستخدمة في العديد من أجهزة إنترنت الأشياء، مع أزمنة قرار على ترتيب عشرات المللي ثانية.

Figure 2
الشكل 2.

من المحاكاة إلى شبكات المستشعرات في العالم الواقعي

تخلص الدراسة إلى أن الجمع بين الطاقة اللاسلكية ومتحكم مبني على التعلم يمكن أن يطيل بشكل ملحوظ عمر وموثوقية شبكات المستشعرات، خاصة عندما تكون الظروف غير متوقعة وتختلف المهام في الإلحاح. بالاعتراف بأن دوائر الحصاد تتشبع، وأن بيئة الراديو تتقلب، وأن بعض الحساسات تكون أكثر أهمية من غيرها في لحظات معينة، يتعلم النهج المقترح موازنة الاحتياجات المتنافسة أفضل من القواعد الثابتة. ويؤكد المؤلفون أن نتائجهم حتى الآن تعتمد على محاكاة وأن المكاسب الدقيقة ستحتاج إلى تأكيد على عتاد حقيقي. مع ذلك، يشير عملهم إلى مستقبل يمكن فيه لشبكات واسعة من الأجهزة الصغيرة أن تعمل لفترات طويلة مع الحد الأدنى من التدخل البشري، وهي تقتات بالطاقة من الهواء بشكل ذكي مع الحفاظ على تدفق البيانات الحيوية.

الاستشهاد: Chen, H., Wang, X., Yuan, L. et al. DQN-empowered energy optimization for wireless powered communication networks. Sci Rep 16, 7987 (2026). https://doi.org/10.1038/s41598-026-38904-x

الكلمات المفتاحية: الطاقة اللاسلكية, إنترنت الأشياء, حصاد الطاقة, التعلم التعزيزي, شبكات المستشعرات