Clear Sky Science · ar

إعادة التفكير في هندسة السياق باستخدام بنية قائمة على الانتباه

· العودة إلى الفهرس

لماذا تهم المساعدات البرمجية الأكثر ذكاءً

كل نقرة تقوم بها في تطبيق أعمال—تسجيل الدخول، رفع ملف، تشغيل تقرير—تترك أثرًا. لو أمكن للبرمجيات أن تتنبأ بحركتك التالية بشكل موثوق، لكانت قادرة على تحميل البيانات مسبقًا، واقتراح اختصارات، والاستجابة فورًا تقريبًا. تستعرض هذه الورقة طريقة جديدة لتعليم الحواسيب فهم هذه السلاسل من الأفعال بعمق بما يكفي ليتمكن المساعدون الرقميون من توقع ما ستفعله بعد ذلك، وما الذي تحاول تحقيقه، ومتى على وشك إنهاء الجلسة.

Figure 1
Figure 1.

من السلاسل البسيطة إلى الأنماط الغنية

تعتمد العديد من الأنظمة الحالية التي تخمن الخطوة التالية للمستخدم على سلاسل ماركوف، وهي أداة رياضية كلاسيكية تنظر فقط إلى الإجراء الأخير للتنبؤ بما سيأتي بعده. مع أنها سريعة ومريحة، فإن طريقة «الذاكرة خطوة واحدة» هذه تنهار في أماكن العمل الحقيقية، حيث تتكشف مهام مثل بناء خط أنابيب تعلم آلي أو إعداد لوحة معلومات على مدار خطوات عديدة وتستعمل أدوات مختلفة. يجادل المؤلفون أن مثل هذه النماذج البسيطة تفوّت البنية طويلة المدى، ولا يمكنها التعامل إلا مع هدف تنبؤ واحد في كل مرة، ويصعب مقارنتها عبر الدراسات لأنها عادةً ما تعتمد على سجلات خاصة وخيارات تنظيف بيانات غير شفافة.

مخطط جديد للتعلّم متعدد المهام

لتجاوز هذه القيود، تقدم الورقة نموذج محوّل قائم على الانتباه—وهي نفس عائلة التقنيات وراء أدوات اللغة الحديثة—معاد تصوره لسلوك المستخدم. بدلًا من تعلم شيء واحد فقط، يُدرّب النموذج على حل ثلاث مهام مترابطة في وقت واحد: التنبؤ بالإجراء التالي (أي واجهة برمجة التطبيقات التي سيستدعيها المستخدم)، استنتاج الهدف العام للجلسة (مثل تشغيل سير عمل تعلم آلي، إجراء تحليل بيانات، إدارة المستخدمين، أو إنشاء تصورات سريعة)، وتقرير ما إذا كانت الخطوة الحالية من المرجح أن تكون الأخيرة في الجلسة. تشترك هذه المهام الثلاث في «عمود فقري» موحد يحول تاريخًا قصيرًا من الإجراءات الأخيرة إلى تمثيل واحد غني لما يجري، ومن ثم يُغذى هذا التمثيل إلى ثلاث وحدات تنبؤ صغيرة.

بناء بيئة اختبار واقعية محاكاة

نظرًا لأن سجلات نشاط المؤسسات الحقيقية غالبًا ما تكون حساسة ويصعب مشاركتها، بنى المؤلفون بيئة محاكاة متطورة تحاكي كيفية استخدام مهنيي البيانات لمنصة داخلية كبيرة. عرفوا 100 واجهة برمجة تطبيقات متميزة مجمعة في 10 مجالات وظيفية، بما في ذلك المصادقة، إدخال البيانات، المعالجة، تدريب النماذج، التصور، التصدير، والإدارة. تتبع أربع شخصيات مستخدم—عِلماء البيانات، محللو الأعمال، المطورون، والمستخدمون المتقدمون—سير عمل مميزة لكنها غير مثالية، مع احتمالات تعكس السلوك الروتيني أحيانًا والانحرافات العرضية أحيانًا أخرى. يحتوي مجموعة البيانات الناتجة على 2000 جلسة مستخدم و20000 استدعاء لواجهات برمجة التطبيقات، مع أهداف جلسات مثل «خط أنابيب تعلم آلي» و«تصور سريع» تُنتج مسارات يمكن التعرف عليها مثل تسجيل الدخول، تحميل البيانات، معالجتها، إنشاء رسم بياني، وتصدير النتيجة.

Figure 2
Figure 2.

مدى تعلم النموذج للتوقع

عندما تدرّب على هذه البيئة المنظمة والمتنوّعة، أظهر نموذج المحوّل أن التعلم القائم على الانتباه يمكنه التقاط الانتظامات الخفية في سلوك المستخدم أفضل بكثير من الأساليب القديمة. بالنسبة للمهمة الرئيسية—تخمين استدعاء واجهة البرمجة التالي ضمن 100 خيار—يحقق الإجابة الصحيحة تمامًا لما يقرب من 80% من الوقت، ويضع الخيار الصحيح ضمن أفضل خمسة اقتراحات له لأكثر من 99.9% من الحالات، وهو تحسّن يزيد أكثر من أربعة أضعاف مقارنة بسلسلة ماركوف الأساسية. في الوقت نفسه، يحدد بشكل صحيح الهدف العام للجلسة في نحو 82% من الحالات ويكشف تقريبًا بشكل مثالي متى تكون الجلسة على وشك الانتهاء. يؤكد المؤلفون أيضًا أن النموذج مضغوط وكفء نسبيًا، مما يجعل الاستخدام في الزمن الحقيقي ممكنًا للمساعدين الذين يجب أن يستجيبوا دون تأخير ملحوظ.

أدوات لإعادة الاستخدام والتوسعة

لجعل نهجهم أكثر من مجرد تجربة مؤقتة، أصدر المؤلفون حزمة برمجية مفتوحة المصدر تسمى context-engineer، إلى جانب مجموعة البيانات المحاكاة الكاملة. مع هذه الموارد، يمكن للباحثين والممارسين إعادة إنتاج النتائج المبلغ عنها، واختبار نماذج بديلة على معيار مشترك، أو توصيل سجلاتهم الداخلية عن طريق تحويل الإجراءات وتسميات الجلسات إلى صيغة رقمية بسيطة. تعالج هذه الشفافية عائقًا رئيسيًا في المجال، حيث لم تتمكن العديد من الأنظمة السابقة من أن تُقارن أو تُعاد استخدامها بشكل عادل لأن بياناتها وبرمجياتها لم تكن متاحة.

ماذا يعني هذا للمستخدمين العاديين

لغير المتخصصين، الخلاصة أن الورقة تقدم وصفة عملية لجعل الأدوات الرقمية تبدو «متقدمة خطوة واحدة». من خلال التعلم المشترك لما يحاول الناس فعله، وما المحتمل أن ينقروا عليه بعد ذلك، ومتى ينهون، يحول النظام المقترح القائم على المحوّل سجلات المستخدمين إلى شكل من أشكال وعي السياق. في التطبيقات الحقيقية، قد يعني هذا روبوتات محادثة تُعد التقرير التالي قبل أن تطلبه، منصات تحليلات تقترح إجراءات متابعة معقولة، ولوحات معلومات مؤسسية تقلل زمن الانتظار بهدوء. رغم أن الدراسة الحالية مبنية على بيانات محاكاة وتحتاج اختبارًا على سجلات حقيقية، فإنها تضع أساسًا واضحًا وقابلًا للتكرار لبناء مساعدات برمجية أكثر ذكاءً واستباقية عبر أنواع عديدة من المنصات الرقمية.

الاستشهاد: Yin, Y. Rethink context engineering using an attention-based architecture. Sci Rep 16, 8851 (2026). https://doi.org/10.1038/s41598-026-43111-9

الكلمات المفتاحية: تنبؤ سلوك المستخدم, التوصية التسلسلية, المحوّل القائم على الانتباه, المساعدون الرقميون الاستباقيون, هندسة السياق