Clear Sky Science · ar

التعلم المعزز الفدرالي المعزز بالتفاوض لجدولة التدفقات بين الحافة والسحابة دون تعارض

2026-03-26 · العودة إلى الفهرس

لماذا تحتاج التطبيقات الذكية إلى حركة مرور أكثر سلاسة خلف الكواليس

من خرائط المرور الحية إلى حسّاسات المصانع، تعتمد العديد من التطبيقات الحديثة على تدفّق مستمر من البيانات الذي يجب معالجته في غضون ميليثوانٍ. لمواكبة ذلك، توزع الشركات الحسابات عبر أجهزة الحافة القريبة وخوادم السحابة البعيدة. لكن عندما تتخذ أجزاء كثيرة من هذه الشبكة قراراتها في وقت واحد، قد تتصادم وتسبب ازدحامات رقمية، وتكاليف متصاعدة، واستجابات متباطئة. يستعرض هذا البحث طريقة جديدة لتنسيق تلك القرارات بحيث تبقى تطبيقات البث سريعة ومستقرة وفعالة حتى مع تغيّر الطلب بشكل كبير.

Figure 1. كيف تتشارك أجهزة الحافة والسحابة عبء معالجة التدفقات بسلاسة دون إبطاء التطبيقات

أوجاع نمو تعاون الحافة والسحابة

تبعث الكاميرات الذكية والمركبات وحساسات المصانع الآن تدفقات بيانات لا تنقطع يجب تحليلها في الوقت الحقيقي. تقلل حواسب الحافة القريبة من المستخدمين زمن الاستجابة، بينما تضيف مراكز بيانات السحابة قدرة حسابية إضافية. مع ذلك، فإن قرار اختيار موضع تنفيذ كل جزء من العمل معقّد، لأن المهام مترابطة وأحجام العمل قد تتفجر دون سابق إنذار. تعتمد طرق الجدولة التقليدية على قواعد ثابتة أو تخطيط غير متصل بالوقت. تعمل هذه الأساليب في بيئات أكثر هدوءًا لكنها تواجه صعوبة عندما يتعين على آلاف المهام والآلات التكيف كل ثانية عبر مناطق متعددة. قد تصبح السيطرة المركزية عائقًا، بينما تتصارع وحدات التحكم المحلية المستقلة تمامًا على الموارد المشتركة.

التعلم للجدولة، لكن من دون تدافع

تتيح المناهج الحديثة لوكلاء البرمجيات تعلم قواعد جدولة جيدة بالتجربة والخطأ، وهي تقنية تُعرف بالتعلم المعزز. يسمح التعلم الفدرالي لعدد كبير من الوكلاء بالتدريب معًا مع إبقاء بياناتهم المحلية خاصة، وهو أمر مهم للخصوصية والنطاق الترددي. ومع ذلك، عندما يتعلّم كل عنقود من عناقيد الحافة بمفرده ويتزامن نماذجه نادرًا، قد تظل أفعالهما متضاربة. قد يقوم عنقودان بإسناد الأحمال إلى نفس خوادم السحابة في الوقت نفسه، أو يعيدان توزيع المهام ذهابًا وإيابًا، مما يخلق تأخيرًا إضافيًا وهدرًا في الطاقة. يرى المؤلفون أن ما ينقص هو وسيلة صريحة لهؤلاء الوكلاء للتواصل والتفاوض قبل التصرف.

مائدة تفاوض لجدولة رقمية

الإطار المقترح، FedNeg-RL، يضيف طبقة تفاوض خفيفة فوق التعلم المعزز الفدرالي. لكل عنقود من أجهزة الحافة وكيل ممثل يراقب الحمل المحلي، يتنبأ بحركة المرور القريبة، ويتتبع المهام الأكثر حساسية للتأخير. قبل إجراء تغييرات قد تؤثر على الروابط أو عقد السحابة المشتركة، يتبادل هؤلاء الممثلون ملخّصات موجزة، مثل الحمل المتوقّع والأثر المحتمل لتحركاتهم، بدلًا من البيانات الخام. باستخدام بروتوكولات جدالية بسيطة، يتفاوضون على خطة مشتركة تتجنب الاصطدامات، ثم يطبّق كل عنقود الإجراء المتفق عليه محليًا. مع الزمن، يُشكّلُ مسار تعلمهم لتفضيل الخطط التي تحافظ على زمن استجابة منخفضًا، وتوازن الطاقة والتكلفة، ونُدرة الصراعات.

Figure 2. كيف تتفاوض مجموعات الحافة المتجاورة لموازنة المهام وتجنب الصراعات على الموارد المشتركة

اختبار المنهج في مدن افتراضية مزدحمة

لتقييم FedNeg-RL، بنى المؤلفون محاكيات مفصّلة لأحمال نمط إنترنت الأشياء، بما في ذلك مئات المهام المترابطة وتدفّقات بيانات متفجّرة يصعب التنبؤ بها شبيهة بتلك الموجودة في مراقبة حركة المرور في المدن الذكية. قارنوا طريقتهم مع مجدولات قائمة على قواعد، وخوارزميات تطورية، والتعلم المعزز المحلي القياسي، والتعلم الفدرالي النقي، ووكيل تعلم مركزي واحد. عبر العديد من السيناريوهات، قلّص FedNeg-RL عدد إعادة التهيئات المزعزعة الناتجة عن الصراعات حتى 41 في المئة، وخفّض زمن الاستجابة عند الحافة العليا (أبطأ 10 في المئة من الاستجابات) بنحو 20 إلى 28 في المئة، وقلّل عبء التكيّف بنحو 35 في المئة. كما وزّع استهلاك الطاقة بشكل أكثر توازناً ووسّع الأداء جيدًا مع ازدياد عدد المهام والآلات.

ما يعنيه هذا لأنظمة الاتصالات المستقبلية

بعبارات بسيطة، يبيّن FedNeg-RL أن تعليم وحدات التحكم البرمجية ليس فقط التعلم من التجربة بل أيضًا التفاوض مع نظرائها يمكن أن يجعل البنية التحتية المشتركة للحافة والسحابة تعمل بسلاسة أكبر. بدلاً من قرارات مبعثرة ومتنافسة، تنسق العناقيد بما يكفي للحفاظ على استجابة تطبيقات البث واستقرارها وكفاءتها، من دون كشف بيانات خاصة أو الاعتماد على دماغ مركزي واحد. مع اتساع نطاق النشر الحقيقي وتعقّده، قد يساعد هذا النوع من التعلم الواعي بالتفاوض في ضمان أن القماش الحاسوبي الخفي خلف المدن والمصانع والخدمات الذكية يظل يعمل بهدوء في الخلفية، حتى مع تغيّر الطلبات باستمرار.

الاستشهاد: Kang, X., Hua, C. Negotiation-augmented federated reinforcement learning for conflict-free edge–cloud stream scheduling. Sci Rep 16, 15158 (2026). https://doi.org/10.1038/s41598-026-45004-3

الكلمات المفتاحية: جدولة الحافة والسحابة, التعلم المعزز الفدرالي, بث إنترنت الأشياء, تفاوض متعدد الوكلاء, تقليل الكمون