Clear Sky Science · ar
تحسين الأداء القائم على Soft Actor Critic لأنظمة الراديو المعرفي المدعومة بواجهات عاكسة ذكية
موجات هواء أذكى لعالم لاسلكي مزدحم
هواتفنا وأجهزة الاستشعار ومنازلنا الذكية كلها تتنافس على نفس المورد غير المرئي: موجات الراديو. مع اتصال المزيد من الأجهزة، يصبح تحقيق أداء إضافي من الطيف المحدود أمرًا حيويًا. تستعرض هذه الورقة طريقة جديدة لزيادة معدلات البيانات للمستخدمين ذوي الأولوية المنخفضة دون الإضرار بالمستخدمين ذوي الأولوية العالية، من خلال الجمع بين «جدران ذكية» تقوم بإنعكاس موجات الراديو وطريقة تعلم اصطناعي تُعلم الشبكة كيفية ضبط نفسها.

المشاركة دون التداخل مع الجيران
تستخدم الأنظمة اللاسلكية الحديثة غالبًا نموذج «المستخدم الأساسي» و«المستخدم الثانوي». للمستخدمين الأساسيين، مثل الخدمات المرخّصة، أولوية الوصول إلى ترددات معينة. يُسمح للمستخدمين الثانويين بإعادة استخدام نفس القنوات فقط إذا حافظوا على تداخلهم تحت حدود صارمة. هذه هي الفكرة الجوهرية وراء الراديو المعرفي: أجهزة راديو تستشعر بيئتها وتتكيّف بحيث يُستخدم الطيف بكفاءة أكبر. التحدي هو منح المستخدمين الثانويين معدلات بيانات جيدة مع البقاء شبه غير مرئيين للمستخدمين الأساسيين. تعتمد الأساليب التقليدية على معالجة إشارية ذكية في محطة القاعدة وحدها، والتي تصبح معقدة بسرعة مع ازدياد كثافة الشبكات وإضافة المزيد من الهوائيات.
انحناء الإشارات بواجهات عاكسة ذكية
يضيف المؤلفون أداة قوية إلى المزيج: الواجهات العاكسة الذكية. هذه ألواح رقيقة مكونة من العديد من العناصر السلبية الصغيرة التي يمكنها تعديل كيفية انعكاس موجات الراديو الواردة، كأنها جدار من المرايا القابلة للتحكم لإشارات اللاسلكي. من خلال اختيار نمط الانعكاس بعناية، يمكن للسطح توجيه الطاقة نحو المستخدم الثانوي المقصود وبعيدًا عن مستقبلات المستخدم الأساسي، محسنًا الأداء دون إنفاق قدرة إرسال إضافية. تحلل الورقة نظامًا حيث تخدم محطة قاعدة ذات هوائيات متعددة المستخدمين الثانويين، بينما تساعد عدة ألواح عاكسة في تشكيل المسارات التي تسلكها الإشارات عبر البيئة، تحت ظروف انتشار ملائمة لميليمترات الموجة.
تعليم الشبكة لضبط نفسها
إيجاد أفضل تركيبة من أنماط توجيه محطة القاعدة، قدرة الإرسال، وملايين إعدادات الانعكاس الدقيقة هو مسألة رياضية فوضوية. طرق التحسين الكلاسيكية، مثل تدرج الإحداثيات القطعي (block coordinate descent)، تتعامل معها بالتناوب بين مجموعة من المتغيرات وأخرى. هذه الطرق تعمل لكنها تصبح بطيئة وغير عملية مع زيادة أحجام الأسطح أو تغير البيئة. بدلًا من ذلك، يصوغ المؤلفون المهمة كمشكلة تعلم لوكيل تعلم معزز عميق باستخدام خوارزمية soft actor-critic (SAC). في هذا الإعداد، يراقب الوكيل ظروف القناة الحالية، مراحل الانعكاس السابقة، وقدرة الإرسال، ثم يقترح إعدادات انعكاس جديدة. يتلقى مكافأة تعتمد أساسًا على معدل البيانات المحقق للمستخدم الثانوي، طالما بقي التداخل للمستخدمين الأساسيين أدنى من العتبة المسموحة. عبر العديد من التفاعلات المحاكاة، يتعلم الوكيل سياسة تربط الملاحظات مباشرة بتكوينات قريبة من المثلى.

النتائج في المحاكاة والأجهزة
من خلال محاكاة واسعة، يُقارن المتحكم القائم على SAC بمرجع تقليدي يعتمد على تدرج الإحداثيات القطعي على عدة محاور: معدل البيانات الذي يمكن تحقيقه للمستخدمين الثانويين، تأثير عدد عناصر وأسطر الألواح العاكسة، حدود قدرة الإرسال، وقيود التداخل. تطابق السياسة المتعلمة أو تتجاوز المرجع باستمرار في معدل البيانات، لا سيما عندما تحتوي الواجهات العاكسة على عدد كبير من العناصر، بينما تتطلب حسابات تكرارية أقل بكثير بمجرد اكتمال التدريب. كما تقيم الدراسة زمن التشغيل: للأسطح الصغيرة قد تكون الطرق الكلاسيكية أسرع قليلًا، لكن مع زيادة حجم النظام يتوسع نهج التعلم بشكل أفضل. لدعم النشر العملي، يصمم المؤلفون ويصنعون ويختبرون مصفوفة هوائيات محطة قاعدة مكوّنة من 16 عنصرًا تعمل من 3 إلى 7 جيجاهرتز. تُظهر القياسات توافقًا جيدًا، وارتباطًا منخفضًا بين الهوائيات، وكفاءة إشعاع تقارب 90٪، مما يؤكد أن منصة الأجهزة قادرة على دعم عمليات متعددة الهوائيات المطالبة.
ما يعنيه هذا لشبكات الاتصالات المستقبلية
بعبارات يومية، توضح هذه الدراسة كيف يمكن للجمع بين الألواح العاكسة الذكية وخوارزمية تعلم أن يسمح للأجهزة ذات الأولوية الأدنى بمشاركة الطيف بشكل أكثر جرأة دون إزعاج الخدمات ذات الأولوية الأعلى. بدلًا من الصيغ المصممة يدويًا، تتعلم الشبكة كيفية توجيه وتشكيل إشاراتها بنفسها، حتى في بيئات معقدة ومع وجود العديد من العناصر القابلة للتحكم. مع تطور الأنظمة اللاسلكية لما بعد الجيل الخامس، قد تساعد مثل هذه المناهج في تقديم معدلات بيانات أعلى، وتغطية أفضل، واستخدام أكثر كفاءة للطيف النادر، مع الحفاظ على التحكم في التداخل.
الاستشهاد: Ghallab, R., Abdrabo, A. & Elashry, I. Soft actor critic-based performance optimization for IRS-aided cognitive radio systems. Sci Rep 16, 14283 (2026). https://doi.org/10.1038/s41598-026-49465-4
الكلمات المفتاحية: الراديو المعرفي, الواجهات العاكسة الذكية, التعلم المعزز العميق, مشاركة الطيف اللاسلكي, soft actor critic