Clear Sky Science · ar
التعلم المعزز العميق لتحسين موارد الشبكة في شبكات MIMO-NOMA لزيادة الاستفادة مع أدنى حمل زائد
لماذا تهم شبكات الهواتف الأذكى
مع تنافس هواتفنا وسياراتنا والآلاف من الحساسات على عرض النطاق اللاسلكي، تكافح الشبكات الحالية للحفاظ على اتصال الجميع بسلاسة، لا سيما عندما يتحرك المستخدمون بسرعة عبر المدن وعلى الطرق السريعة. تعرض هذه الورقة طريقة جديدة لجعل شبكات الجيل الخامس والجيل السادس المستقبلية أكثر كفاءة وموثوقية بكثير عبر تعليم الشبكة، في الوقت الفعلي، أي الاتصالات يجب استخدامها وكيفية مشاركة الموارد الراديوية المحدودة بين العديد من المستخدمين بأدنى هدر.

الهواء المزدحم ومشكلة الازدحام
تحتاج أنظمة الاتصالات اللاسلكية الحديثة إلى خدمة أعداد هائلة من المستخدمين الذين يتحركون باستمرار. تقنيات جديدة مثل MIMO، التي تستخدم العديد من الهوائيات في آن واحد، وNOMA، التي تسمح لعدة مستخدمين بمشاركة نفس شريحة الطيف، تعد بزيادات كبيرة في السعة. لكن عمليًا، عندما يسافر الناس بالسيارة أو القطار وتتقلب الإشارات بسرعة، يصبح من الصعب للغاية تقرير أي محطة أساسية يجب ربط كل مستخدم بها، وكمية الطاقة التي يجب تخصيصها، وكيفية منع المستخدمين من التداخل مع بعضهم البعض. تفترض العديد من أساليب التحسين القائمة ظروفًا مستقرة إلى حد ما أو معرفة مثالية لقناة الراديو، وهي افتراضات تنهار في البيئات الواقعية السريعة والمزدحمة.
ترك الشبكة تتنبأ بأفضل اتصال
يقترح المؤلفون نهجًا يسمى OSIANRO يبدأ بتحسين كيفية تخصيص الأجهزة للشبكات والقنوات. بدلًا من الاعتماد على قواعد ثابتة، يستخدم نسخة معززة من طريقة تعلم آلي شائعة تُعرف بتعزيز التدرج (gradient boosting). يتعلم هذا النموذج المطور من أمثلة كثيرة لسلوك الشبكة في الماضي — مثل قوة الإشارة، التأخير، ونوع التطبيق المستخدم — للتنبؤ بما إذا كان خيار الاتصال المعين من المرجح أن ينجح أم يفشل. أعيد تصميم الطريقة رياضيًا لمعاقبة القرارات المعقدة للغاية والتعامل مع حالات نادرة ولكنها مهمة، مثل المستخدمين الذين يصعب خدمتهم. من خلال تقييم وترتيب ما هي قطع المعلومات الأكثر أهمية بعناية، يركز فقط على السمات الأكثر فائدة، مما يقلل زمن اتخاذ القرار والأخطاء.
تعليم الشبكة المشاركة العادلة وتجنب الصدامات
بعد أن يختار OSIANRO شبكة أو قناة واعدة، يجب أن يقرر كيفية مشاركة الطيف والطاقة بين العديد من المستخدمين. يبني المؤلفون نموذجًا رياضيًا مفصلاً يصف كمية البيانات التي يمكن للمستخدمين إرسالها، وكيفية تداخل الإشارات، وعدد المرات التي يصطدم فيها المستخدمون عند محاولتهم استخدام الهواء في وقت واحد. بدلًا من حل هذا اللغز المعقد بصيغ ثابتة، يستخدم النظام التعلم المعزز العميق، حيث يتعلم العديد من الوكلاء البرمجيين من خلال التجربة والخطأ. يمثل كل وكيل مستخدمًا يختار أي كتلة موارد يمكن الوصول إليها ومدى عدوانيته في المنافسة عليها. يتلقى الوكلاء مكافآت عندما ترتفع معدلات البيانات الإجمالية وعقوبات عندما يزيد التداخل أو الحمل على القناة، ويتقاربون تدريجيًا إلى استراتيجيات تحافظ على انخفاض التصادمات مع دفع إجمالي الإنتاجية إلى الأعلى.

الأداء في شوارع المدينة والطرق السريعة
لاختبار OSIANRO، يقوم المؤلفون بمحاكاة سيناريوهات حضرية وطريق سريع واقعية باستخدام نماذج قنوات معروفة وأدوات مفتوحة المصدر. يقارنون نظامهم بمعيار متقدم يستخدم جهازًا متخصصًا مستوحى من مبادئ الكم لتحسين تخصيص الموارد. عبر العديد من التجارب، يزيد OSIANRO باستمرار معدل البيانات الكلي، ويستخرج مزيدًا من المعلومات من كل وحدة طيف، ويقلل بشدة من عدد التصادمات، حتى مع زيادة عدد المستخدمين وسرعاتهم. يثبت اختيار الشبكة المعزز بتقنية تعزيز التدرج أنه أكثر دقة وأسرع من الإصدارات القياسية، بينما يتكيف مكون التعلم المعزز بسلاسة مع تغير ظروف الراديو دون الاعتماد على معرفة سابقة مثالية.
ماذا يعني ذلك للاتصال اليومي
ببساطة، تُظهر هذه الدراسة أن منح الشبكات اللاسلكية القدرة على التنبؤ والتعلم بنفسها يمكن أن يجعل الموجات الهوائية المزدحمة تتصرف أشبه بالشوارع المنظمة بدلًا من مواقف السيارات الفوضوية. من خلال اختيار ذكي لأي برج وقناة يجب أن يستخدمها كل جهاز، وبالتعديل المستمر لكيفية مشاركة المستخدمين للطيف، يقدم OSIANRO المزيد من البيانات لمزيد من المستخدمين مع تباطؤات وأعطال أقل. رغم أن النتائج مستمدة من محاكاة مفصلة بدلاً من نشرات حية، فإنها تشير إلى مسار عملي نحو شبكات متنقلة تظل سريعة وعادلة ومستقرة حتى عندما نُحِشُّها بسيارات وقطارات ومليارات الأجهزة المتصلة المتحركة.
الاستشهاد: Lahza, H., Sreenivasa, B.R., Lahza, H. et al. Deep reinforcement learning for network resource optimization in MIMO-NOMA networks to maximize utilization with minimal overhead. Sci Rep 16, 12635 (2026). https://doi.org/10.1038/s41598-026-42953-7
الكلمات المفتاحية: تخصيص موارد 5G, MIMO NOMA, التعلم المعزز العميق, تحسين الشبكات, تداخل لاسلكي