Clear Sky Science · ar
تكييف المعدل في XP-HARQ المعتمد على NOMA: منظور لامركزي متعدد الوكلاء باستخدام التعلم المعزز العميق
لماذا الروابط اللاسلكية الأسرع والأكثر موثوقية مهمة
مع اتصال الأشياء اليومية من روبوتات المصانع إلى حسّاسات المنازل بالإنترنت، يجب أن توفر شبكاتنا اللاسلكية رسائل صغيرة بسرعة فائقة ومع معدلات فشل شبه منعدمة. تستكشف هذه الورقة طريقة جديدة لدفع المزيد من البيانات عبر الطيف المزدحم مع تلبية أهداف صارمة للموثوقية والتأخير، وهو تحدٍ جوهري لأنظمة الجيل السادس وبيئات إنترنت الأشياء المتقدمة.

إرسال أصوات متعددة عبر نفس الهواء
تحاول الأنظمة اللاسلكية التقليدية تجنّب التداخل بمنح كل جهاز فاصل زمني أو ترددي خاصًا به، مثل متصلين يتبادلون الأدوار على خط مشترك. فكرة أحدث تُعرف بالوصول المتعدد غير المتعامد تتيح لعدة أجهزة التحدث في وقت واحد على نفس الموارد، بينما تقوم محطة القاعدة بتمييز إشاراتهم المتداخلة. هذا يزيد السعة لكنه يجعل التحكم الدقيق في معدلات البيانات والطاقة أمراً أساسياً، خصوصًا عندما يجب على الأجهزة تلبية متطلبات الموثوقية الفائقة وقليل الكمون مثل تأخيرات بمقدار مللي ثانية ومعدلات خطأ منخفضة جداً.
جعل إعادة الإرسال أذكى، وليس أطول فقط
لضمان وصول الرسائل بشكل صحيح، تعتمد الشبكات الحالية غالبًا على طلبات الإعادة التلقائية: إذا أتلفت حزمة، يعاد إرسالها. وعلى الرغم من أن ذلك يحسن الموثوقية، فإن الإعادات البسيطة تهدر الطيف الثمين ويمكن أن تتسبب في تراكم الطوابير عندما يكون العديد من الأجهزة نشطًا. نهج أكثر كفاءة، يعرف بإعادة الطلب التلقائي الهجين عبر الحزم المتصالبة (cross-packet HARQ)، يمزج بذكاء معلومات جديدة بالقديمة خلال كل إعادة إرسال. بدلاً من إعادة إرسال نفس البتات، تحمل كل إعادة مزجًا لمعلومات إضافية للبيانات الفاشلة بالإضافة إلى محتوى جديد، ما يستخلص مزيدًا من المعلومات المفيدة في كل محاولة إرسال.

السماح للأجهزة بتعلم السلوك الجيد بنفسها
يجمع دمج الوصول عبر القناة المشتركة مع الإعادات الذكية نظامًا قويًا ولكنه معقد للغاية. ترى محطة القاعدة إشارات تعتمد على عوامل كثيرة: تغير ظروف القناة اللاسلكية، وتداخل المستخدمين، وخلط الحزم عبر جولات متعددة. تواجه الأساليب الرياضية الكلاسيكية صعوبة في هذا الإطار، خصوصًا عندما تعرف الأجهزة فقط معلومات جودة القناة القديمة. بدلًا من ذلك، يعامل المؤلفون كل جهاز إنترنت أشياء كوكيل متعلم يعدّل معدل الإرسال الخاص به عبر الزمن. باستخدام فرع من الذكاء الاصطناعي يُسمى التعلم المعزز العميق متعدد الوكلاء، يستكشف هؤلاء الوكلاء خيارات معدل مختلفة، يلاحظون نجاح أو فشل حزمهم، ويكتشفون تدريجيًا استراتيجيات تحافظ على الشبكة سريعة وموثوقة.
التعلّم التنافسي مقابل التعاوني
تقارن الدراسة بين أسلوبين للتعلّم. في الأسلوب التعاوني، تشارك كل الأجهزة هدفًا مشتركًا: تعظيم إجمالي الإنتاج المفيد للشبكة بأكملها. في الأسلوب التنافسي، يركّز كل جهاز أساسًا على معدل بياناته بعيد المدى مع الالتزام بقواعد الموثوقية. كلا المقاربتين تستخدمان طريقة تعلم متقدمة تتعامل مع اختيارات معدلات مستمرة وتمنع تقديرات القيمة من أن تصبح متفائلة بشكل مفرط. تظهر المحاكاة أنه في الشبكات الصغيرة يمكن أن يعمل التعلّم المركزي—حيث يقرر متحكم واحد لجميع الأجهزة—لكن هذا يصبح سريعًا غير مستقر وغير فعال مع زيادة عدد الأجهزة. النهج اللامركزي متعدد الوكلاء يقاس بشكل أفضل، ويقدم الإصدار التنافسي أكثر استقرارًا وأعلى إنتاجية عبر مجموعة من ظروف الإشارة.
ماذا يعني هذا للأشياء المتصلة في المستقبل
بالنسبة للقارئ العام، الرسالة الأساسية هي أن شبكات إنترنت الأشياء المستقبلية قد لا تُدار بصيغ ثابتة بل بواسطة أسراب من الوكلاء الصغار المتعلمين داخل الأجهزة نفسها. من خلال دمج الوصول عبر القناة المشتركة، وإعادات أذكى، والتعلّم اللامركزي، ينتقل النظام المقترح بالمزيد من البيانات مع تأخيرات أقل مع الحفاظ على احتمال فشل منخفض للغاية. عمليًا، يعني هذا أن المصانع والمركبات والحساسات الطبية قد تعتمد على روابط لاسلكية تتفاعل فورًا مع الظروف المتغيرة، محافظةً على السرعة والموثوقية دون حاجة لضبط مستمر من البشر.
الاستشهاد: Wang, J., He, F., Shi, Z. et al. Rate adaption of XP-HARQ assisted NOMA: a decentralized multi-agent DRL perspective. npj Wirel. Technol. 2, 18 (2026). https://doi.org/10.1038/s44459-025-00024-9
الكلمات المفتاحية: الاتصال الفائق الموثوقية وقليل الكمون, إنترنت الأشياء, الوصول المتعدد غير المتعامد, الطلب التلقائي المتكرر الهجين, التعلم المعزز متعدد الوكلاء