Clear Sky Science · ar
AsynDBT: الضبط ثنائي المستويات الموزع غير المتزامن للتعلّم داخل السياق بكفاءة مع نماذج اللغة الكبيرة
لماذا تهم المطالبات الأذكى في الذكاء الاصطناعي اليومي
نماذج اللغة الكبيرة تشغّل الآن روبوتات الدردشة ومحركات البحث ومساعدات الكتابة التي يستخدمها العديد من الأشخاص يومياً. ومع ذلك، تظل الحصول على إجابات مفيدة معتمدة بشدة على كيفية صياغة أسئلتنا وأي أمثلة نعرضها على النموذج. تقدم هذه الورقة طريقة جديدة لتحسين تلك المطالبات والأمثلة تلقائياً عبر العديد من الأجهزة، مع الحفاظ على خصوصية بيانات كل مستخدم. والنتيجة نظام ذكاء اصطناعي يتعلم الاستجابة بدقة وكفاءة أكبر، لا سيما في مهام متخصصة مثل صيانة شبكات الاتصالات.
تعليم الذكاء الاصطناعي بالعرض بدلاً من إعادة التدريب
بدلاً من إعادة تدريب نماذج عملاقة باستمرار، يتجه الاتجاه المتصاعد إلى تعليمها «في اللحظة» عن طريق توفير عدد قليل من الأمثلة المختارة بعناية ضمن المطالبة—وهي عملية تُعرف بالتعلّم داخل السياق. فعلى سبيل المثال، لتصنيف مراجعات الأفلام كإيجابية أو سلبية، قد تعرض للنموذج مجموعة صغيرة من الأمثلة الموسومة ثم تطلب منه وسم مراجعة جديدة. لكن المشكلة أن اختيار الأمثلة والصياغة الدقيقة للتعليمات يمكن أن يغير أداء النموذج بدرجة كبيرة. العثور على تركيبات جيدة يدوياً أمر بطيء ومكلف، ومشاركة البيانات الخام بين المؤسسات غالباً ما يكون مستحيلاً بسبب قواعد الخصوصية.
التعاون دون مشاركة البيانات الخاصة
لتجاوز حواجز مشاركة البيانات، يبني المؤلفون على فكرة التعلّم الفيدرالي، وهو إعداد تبقي فيه العديد من الأجهزة أو المؤسسات بياناتها محلياً لكنها تتعاون عبر خادم مركزي. يتواصل كل عامل—مثل محطة قاعدة اتصالات أو خادم شركة—مع نفس نموذج اللغة المستضاف في السحابة، لكنه لا يرفع نصه الخام أبداً. بدلاً من ذلك، يعيد فقط إشارات تغذية راجعة حول مدى فعالية المطالبات واختيارات الأمثلة المختلفة. خوارزمية جديدة تسمى AsynDBT (الضبط ثنائي المستويات الموزع غير المتزامن) تنسق هؤلاء العمال بحيث يطورون بشكل مشترك استراتيجية مطالبات مشتركة مع احترام الخصوصية والتعامل مع اتصالات الشبكة البطيئة أو غير الموثوقة.

تحسين كل من السؤال والأمثلة
فكرة رئيسية في الورقة هي اعتبار تصميم المطالبة كمشكلة تحسين ذات طبقتين. في الطبقة السفلية، يضبط النظام مقاطع قصيرة تُلحق بتعليمات المهمة—تغييرات طفيفة في الصياغة قد توجه النموذج نحو تفكير أفضل. في الطبقة العليا، يقرر أي الأمثلة الموسومة تُدرج كعروض توضيحية. هاتان الطبقتان تتفاعلان: مجموعات الأمثلة المختلفة تستلزم تعديلات مطالبة مختلفة، والعكس صحيح. يوضح AsynDBT هذه العلاقة رياضياً ويستخدم طريقة تقريبية فعّالة حتى يتمكن كل عامل من تحديث خياراته المحلية تدريجياً بينما يحافظ الخادم المركزي على رؤية عالمية متسقة لقرارات الطبقة السفلية.
التعامل مع الأجهزة البطيئة والمشاركين الخبيثين
في الشبكات الحقيقية، تستجيب بعض الأجهزة متأخرة أو تنقطع، مما يخلق «متأخرين» قد يعيقون التدريب المتزامن القياسي. يعمل AsynDBT بدلاً من ذلك بشكل غير متزامن: يحدث الخادم متغيراته كلما أبلغت مجموعة فرعية من العمال، دون الانتظار للجميع. كما يحمي الطريقة من العمال الذين قد يرسلون تحديثات مضللة، عمداً أو عن طريق الخطأ. من خلال مزيج من تقنيات التنظيم وقواعد التجميع القوية، تقلل الخوارزمية من تأثير اختيارات الأمثلة المسمومة أو منخفضة الجودة على الاستراتيجية العالمية، مما يساعد النظام الكلي على البقاء مستقراً وموثوقاً حتى تحت الهجوم.

مكاسب مثبتة في مهام اللغة والاتصالات
اختبر الباحثون AsynDBT على ست مشكلات تصنيف نصي، بما في ذلك مجموعة بيانات شبكات 5G المطالبة حيث كان على النموذج تقييم ما إذا كانت مصطلحات فنية متخصصة ذات صلة، مستخدماً أجزاءً فقط من معايير الاتصالات كسياق. بالمقارنة مع مجموعة من طرق المطالبة واختيار الأمثلة القائمة، حقق النهج الجديد أفضل دقة أو ثاني أفضل دقة في معظم المهام تقريباً. وعلى وجه الخصوص في مهمة 5G، حسّن الدقة بحوالي عشر نقاط مئوية مقارنة بأقوى الأساليب الأساسية. وفي الوقت نفسه، خفّض التصميم غير المتزامن زمن التدريب بنحو 40 بالمئة مقارنة بطريقة مركزية مماثلة لا توزع العمل.
ماذا يعني هذا لأدوات الذكاء الاصطناعي المستقبلية
لغير الخبراء، الخلاصة أن المطالبات الأفضل واختيارات الأمثلة الأذكى يمكن أن تحسّن بشكل ملحوظ سلوك أنظمة الذكاء الاصطناعي—دون تغيير النموذج الأساسي. يقدم AsynDBT طريقة آلية تحترم الخصوصية لتنفيذ ذلك عبر العديد من الأجهزة المتعاونة، مما يؤدي إلى أدوات لغوية أكثر دقة وكفاءة لمجالات مثل عمليات شبكات الاتصالات، دعم العملاء، ومجالات متخصصة أخرى. وبالنظر إلى المستقبل، يخطط المؤلفون لدمج إطارهم مع استرجاع المعرفة القائم على الرسوم البيانية حتى تتمكن المطالبات أيضاً من الاستفادة من المعلومات الواقعية المحدثة، مما يقلل الهلوسة ويجعل المساعدين الذكيين أكثر موثوقية في البيئات ذات المخاطر العالية.
الاستشهاد: Ma, H., Dou, S., Liu, Y. et al. AsynDBT: asynchronous distributed bilevel tuning for efficient in-context learning with large language models. Sci Rep 16, 9381 (2026). https://doi.org/10.1038/s41598-026-39582-5
الكلمات المفتاحية: التعلّم داخل السياق, تحسين المطالبات, التعلّم الفيدرالي, نماذج اللغة الكبيرة, الذكاء الاصطناعي المحمي للخصوصية