Clear Sky Science · ar

IMFLKD: آلية حوافز للتعلّم الفدرالي اللامركزي قائمة على تقطير المعرفة

· العودة إلى الفهرس

لماذا يمكن أن يكون المشاركة آمنة وعادلة

تعتمد الذكاء الاصطناعي الحديث على البيانات، ومع ذلك معظم بياناتنا مخزنة على هواتف شخصية أو خوادم مستشفيات أو سحابات شركات لا يمكن نسخها أو مشاركتها بسلاسة. يوفر التعلّم الفدرالي وسيلة لتمكين العديد من الأجهزة من تدريب نموذج مشترك دون كشف بياناتهم الخام، لكن أنظمة اليوم ما تزال تعاني من تسريبات خصوصية ونقاط فشل مركزية ومكافآت غير عادلة لمن يساهمون أكثر. يعرض هذا البحث إطاراً جديداً، IMFLKD، يجمع ثلاث أفكار قوية — البلوك تشين، تقطير المعرفة، وتسجيل السمعة — لجعل هذا النوع من التعلم التعاوني أكثر خصوصية وأكثر صلابة وأكثر عدلاً على المدى الطويل.

Figure 1
الشكل 1.

التدريب معاً دون مشاركة الأسرار

في التعلّم الفدرالي الكلاسيكي، يجمع خادم مركزي تحديثات النماذج من العديد من المشاركين ويجري دمجها. هذا يمنع انتقال البيانات الخام، لكن الخادم نفسه يصبح هدفاً مغرياً: إذا فشل يتوقف النظام بأكمله، وإذا كان غير موثوق يمكنه إساءة استخدام أو تسريب معلومات مخفية في تحديثات النموذج. بدلاً من ذلك يستخدم المؤلفون دفتر أستاذ لامركزي قائم على البلوك تشين لتنسيق التدريب. يدرب كل مشارك نموذجًا محليًا على بياناته ثم يتفاعل مع عقود ذكية على البلوك تشين تسجل المساهمات، تجمع المعلومات، وتوزع المكافآت، وكل ذلك دون الاعتماد على سلطة مركزية واحدة.

مشاركة المعرفة، لا النماذج الضخمة

لتقليل تكاليف الاتصالات وحماية الخصوصية أكثر، يعتمد الإطار على تقطير المعرفة. بدلاً من إرسال معلمات النموذج الكاملة، يرسل كل مشارك فقط «تسميات ناعمة» — احتمالات التنبؤ التي يقدمها النموذج لمجموعة من المدخلات المشتركة — وهي أخف حجماً وتكشف أقل عن بيانات فردية. وبما أن مجموعة بيانات مشتركة حقيقية قد لا توجد، يستخدم النظام نموذجًا توليديًا يسمى المُشفّر التلقائي المتغاير المشروط لإنشاء مجموعة بيانات اصطناعية «شبه عامة» تطابق تقريباً توزيع التسميات العام دون كشف سجلات أصلية. يتدرب المشاركون على بياناتهم الخاصة، يقومون بالتنبؤ على هذه المجموعة الاصطناعية، ثم يصقلون نماذجهم باستخدام إشارة مجمعة مستخلصة من المعرفة المجمعة للجميع.

قياس من يساعد فعلاً

تحدٍ مركزي في أي نظام تعاوني هو تحديد مَن يستحق الفضل. يتعامل IMFLKD مع هذا بمنهج تقييم مساهمة مكون من مرحلتين قائم على تجميع التسميات. أولاً، يفحص خوارزم خفيفة الوزن بايزي تنبؤات جميع المشاركين ويستنتج كل من التسمية الأكثر احتمالاً لكل عينة ودرجة جودة لكل نموذج، ويُحدّث هذه الدرجات مع قدوم مهام جديدة. يعمل هذا الأسلوب عبر الإنترنت، دون تخزين البيانات الماضية، ويتعامل مع المساهمين المزعجين أو الخبيثين بتقليل وزن النماذج التي تخالف الإجماع الناشئ. تُظهِر التجارب أن هذا التجميع للتسميات يحسّن الدقة بنحو 10 بالمئة مقارنة بالتصويت بالأغلبية البسيط، مع بقائه سريعًا بما يكفي للبيئات واسعة النطاق والمحدودة الموارد.

تحويل الجودة إلى مكافآت وسمعة

بمجرد معرفة جودة المساهمة، يستخدم IMFLKD مخطط حوافز يُسمى مصل الحقيقة المرجِّح للأقران لتحويلها إلى مكافآت. يُقاس المشاركون مقابل إجماع أقران مرجَّح بالجودة: يحصل من تتوافق تنبؤاتهم مع أقران ذوي جودة عالية على مكافآت أكبر، بينما يُعاقب من ينحرف أو يختلف كثيرًا. يجعل هذا الإبلاغ الصادق الاستراتيجية الأكثر ربحية على المدى الطويل، حتى في مواجهة التواطؤ. إضافة لذلك، يبني النظام درجة سمعة متعددة الأبعاد لكل مشارك، تجمع بين جودة البيانات ومستوى النشاط واستقرار السلوك، وتعدل السلوك القديم بعامل تلاشي زمني. ثم تؤثر السمعة على الجولات اللاحقة من خلال تحديد مدى وزن تنبؤات المشارك وما إذا كان سيُختار لمهام مستقبلية.

Figure 2
الشكل 2.

بناء الثقة في الذكاء الجماعي

بشكل عام، يبيّن إطار IMFLKD أنه من الممكن تنسيق التعلم عبر العديد من الأجهزة المستقلة بطريقة فعّالة وواعية بالخصوصية ومقاومة للمتطفلين والمهاجمين. من خلال مزج توليد البيانات الاصطناعية، وتسجيل المساهمات الصارم، ومكافآت نظرية الألعاب، وتتبع السمعة الديناميكي على بلوك تشين، يشجع النظام المشاركين على التصرف بصدق وباستمرارية عبر جولات تدريب متعددة. للخلاصة العامة: يمكننا استغلال قوة البيانات الموزعة — مثل السجلات الطبية أو قراءات أجهزة الاستشعار أو الأجهزة الشخصية — دون تسليم كل شيء لشركة أو خادم واحد، مع ضمان أن من يقدمون أكثر المعلومات فائدة هم من يستفيدون أكثر.

الاستشهاد: Ying, X., Yan, K., Gao, X. et al. IMFLKD: an incentive mechanism for decentralized federated learning based on knowledge distillation. Sci Rep 16, 10567 (2026). https://doi.org/10.1038/s41598-026-46234-1

الكلمات المفتاحية: التعلّم الفدرالي, البلوك تشين, تقطير المعرفة, آليات الحوافز, أنظمة السمعة