Clear Sky Science · ar

هجمات حقن المطالبات على نماذج اللغة الكبيرة التعليمية للتعليم العالي والمهني

· العودة إلى الفهرس

لماذا هذا يهم الطلاب والمعلمين

تتجه المدارس وبرامج التدريب بشكل متزايد إلى أدوات الذكاء الاصطناعي لتصحيح الأعمال وتقديم التغذية الراجعة وتوجيه الطلاب. تبيّن هذه الورقة أن هذه الأدوات نفسها يمكن أن تُخدع بصمت بواسطة صياغات ذكية مخفية داخل إجابات الطلاب. مثل هذه الخدع قد تضخّم الدرجات وتُعطي تفسيرات خاطئة للنظم الإرشادية وتضلل أنظمة التدريس، مما يثير أسئلة خطيرة حول العدالة والثقة في التعليم المدعوم بالذكاء الاصطناعي.

Figure 1. كيف يمكن للإشارات المخفية في إجابات الطلاب توجيه مصححي الذكاء الاصطناعي نحو نتائج غير منصفة في المدارس وبرامج التدريب.
Figure 1. كيف يمكن للإشارات المخفية في إجابات الطلاب توجيه مصححي الذكاء الاصطناعي نحو نتائج غير منصفة في المدارس وبرامج التدريب.

كيف يمكن أن تُضلّل المصححات الذكية

تعمل نماذج اللغة الحديثة باتباع تعليمات مكتوبة بلغة يومية. في السياق التعليمي، غالبًا ما يجمع الطلب الواحد بين قواعد النظام، وصف المهمة، دليل تقييم مفصل، أمثلة، وإجابة الطالب. وبما أن كل شيء يُعامل كنص واحد طويل، قد يخلط النموذج بين ما هو قاعدة وما هو جزء من إجابة الطالب. يُظهر المؤلفون أن هذا الاختلاط في الأصوات يخلق مخاطرة أمنية جديدة: يمكن للطلاب إخفاء تعليمات إضافية داخل شروح تبدو مفكرة، مما يوجه النموذج لتخفيف درجاته أو تجاهل أجزاء من الدليل دون التصريح بذلك صراحة.

تحويل إجابة عادية إلى هجوم مخفي

تقدم الورقة إطارًا عمليًا خطوة بخطوة لصياغة مثل هذه الإجابات المخادعة. أولًا، تُقسَم المطالبة الكاملة للتصحيح إلى قطعها الرئيسية، مثل قواعد النظام، وصف المهمة، دليل التقييم، ونص الطالب. بعد ذلك، تُصمَّم "دور" لتلعبه الإجابة، مثل الظهور كتقييم ذاتي أو ملاحظة مُصحح. ثم تُدمَج الهجمة في أجزاء من الرد حيث يتوقع النظام وجود استدلال أو انعكاس، بحيث تبدو التعليمات المخفية ككتابة أكاديمية عادية. أخيرًا، تُطابَق الصياغة عن كثب مع لغة الدليل، لأن النماذج تميل إلى مكافأة الإجابات التي تردّد لغة دليل التقييم. والنتيجة النهائية هي رد يبدو ذا صلة للقارئ البشري لكنه يخرّج النموذج بهدوء لمنح درجات أعلى أو التغاضي عن الأخطاء.

Figure 2. كيف تسحب أجزاء ملونة مدمجة داخل إجابة الطالب مُصحح الذكاء الاصطناعي نحو منح درجات أعلى وانتهاك القواعد.
Figure 2. كيف تسحب أجزاء ملونة مدمجة داخل إجابة الطالب مُصحح الذكاء الاصطناعي نحو منح درجات أعلى وانتهاك القواعد.

ماذا تكشف الاختبارات عن المخاطر

لاستقصاء مدى خطورة المشكلة، اختبر المؤلفون طريقتهم على أربع مجموعات معروفة من المهام التعليمية، شملت تصحيح المقالات، إجابات علمية قصيرة، سيناريوهات صفية مختلطة، وأسئلة أكاديمية واسعة النطاق. استخدموا عدة نماذج شائعة مهيّأة بالتعليمات في إعداد صندوق أسود واقعي، مماثل لكيفية نشر الأنظمة التجارية. عبر كل السيناريوهات، نجحت الهجمات المُصمَّمة بمعدل أعلى بكثير من مجموعة من حيل اختراق المطالبات الموجودة. في المتوسط، رفعت الدرجات بأكثر من عشرين بالمئة وحدث ذلك بينما ظل المراجعون البشريون يقيمون الإجابات على أنها طبيعية ومعقولة من الناحية التعليمية. كما بقيت الهجمات فعّالة حتى عند إضافة حماية بسيطة مثل تنظيف المدخلات، فصل الأدوار في المطالبة، أو إجبار مخرجات ذات بنية محددة.

أفكار لأمان أفضل للذكاء الاصطناعي في الفصول

يجادل المؤلفون بأن هذه المشكلات ليست مجرد أخطاء في نموذج بعينه، بل تنشأ من طريقة تصميم مطالبات التقييم التعليمي. لأن كتابة الطالب تؤدي دورين في آن واحد كدليل ومصدر محتمل للتعليمات، يصبح الحد الفاصل بين «ما الذي نقيمه» و«كيف نقيمه» ضبابيًّا. يستعرضون دفاعات تحاول استعادة هذا الحد، مثل استخراج الأدلة الأساسية أولًا ثم تقييمها فقط، إضافة نموذج مُتحقق مستقل لمراجعة الدرجات مقابل الدليل، وفرض روابط صارمة بين الدرجات والأدلة المقتبسة. تهدف هذه الأفكار إلى جعل من الصعب على التعليمات المخفية التأثير على القرار النهائي دون أن تُكتشف.

ماذا يعني هذا لمستقبل تصحيح الذكاء الاصطناعي

بصورة عامة، تُظهر الدراسة أن الأنظمة المستخدمة في التصحيح والتدريس يمكن أن تُستغل بصمت من قبل طلاب يفهمون كيفية صياغة إجاباتهم. وبما أن هذه الأدوات الآن متورطة في قرارات ذات مخاطر عالية، من درجات الدورات إلى الشهادات المهنية، يحث المؤلفون المصممين والمربين على اعتبار الأمان مطلبًا أساسيًا وليس مجرد تفصيل لاحق. سيكون بناء مطالبات أكثر أمانًا، إضافة فحوص لكيفية دعم الأدلة للدرجات، واختبار الأنظمة بانتظام باستخدام مدخلات عدائية خطوات ضرورية للحفاظ على تعليم مدعوم بالذكاء الاصطناعي عادلًا وجديرًا بالثقة.

الاستشهاد: Cai, Y. Prompt injection attacks on educational large language models for higher and vocational education. Sci Rep 16, 15594 (2026). https://doi.org/10.1038/s41598-026-46563-1

الكلمات المفتاحية: حقن المطالبات, أمن تقييمات الذكاء الاصطناعي, نماذج اللغة الكبيرة التعليمية, التقييم الآلي, التعليم المهني