Clear Sky Science · ar

محول مُحسَّن للكشف عن الهلوسة وتحسين الكمون للتعلُّم الذكي في الحافة (HALL-OPT) للذكاء الفوري عند الحافة

· العودة إلى الفهرس

لماذا يهم وجود ذكاء اصطناعي أسرع وأكثر موثوقية

تصبح الأجهزة اليومية أكثر ذكاءً بهدوء، من حسّاسات المصانع ومراقبات المستشفيات إلى السيارات والأجهزة المنزلية. تعتمد العديد من هذه الأنظمة على نماذج لغوية — نفس نوع الذكاء وراء الروبوتات الحوارية الحديثة — لقراءة التعليمات، الإجابة عن الأسئلة، أو تلخيص التقارير. لكن مشكلتين تقفان عائقًا: هذه النماذج بطيئة وتستهلك طاقة كبيرة، وأحيانًا «تهلوس» فتنتج عبارات مقنعة لكنها خاطئة. تقدم هذه الورقة HALL-OPT، إعادة تصميم لنماذج المحول تهدف إلى جعلها أسرع وأكثر موثوقية بحيث يمكن تشغيلها بأمان على أجهزة حافة صغيرة وموفرة للطاقة بدلاً من الاعتماد على مراكز بيانات بعيدة.

Figure 1
الشكل 1.

تحدي الأجهزة الذكية على الحافة

تعيش معظم النماذج عالية الأداء في السحابة، حيث يمكنها استخدام قدر كبير من القدرة الحاسوبية. وهذا يجعل من الصعب استخدامها في أماكن تتطلب قرارات سريعة وروابط شبكات غير مثالية أو مكلفة، مثل المركبات الذاتية، الروبوتات الصناعية، أو أجهزة الرعاية بجانب السرير. عندما ترسل مثل هذه الأنظمة بيانات إلى السحابة وتنتظر ردًا، قد تكون التأخيرات حتى لعدة مئات من الملِّي ثانية غير مقبولة. في الوقت نفسه، تميل النماذج الأخف التي تتناسب مع أجهزة الحافة إلى الاستجابة بسرعة أكبر لكن تكون أكثر عرضة لاختلاق الحقائق أو تفسير المعلومات خطأً. تُظهر الدراسة أن هذا يخلق مقايضة: انخفاض الهلوسة عادةً ما يأتي مع زمن استجابة مرتفع، بينما الزمن المنخفض غالبًا ما يعني المزيد من الهلوسات، مما يترك فجوة للحلول المطلوبة للذكاء الموثوق في الوقت الفعلي على الحافة.

تصميم موحّد بدلاً من حلول منفصلة

تتعامل الأبحاث الحالية عادةً مع الموثوقية والكفاءة كهدفين منفصلين. تركز بعض الأساليب على التقاط الهلوسات عبر التحقق من الإجابات مقابل قواعد بيانات خارجية أو تشغيل نماذج متعددة مرات، ما يضيف وقتًا واستهلاكًا للطاقة. أساليب أخرى تقلّص النماذج باستخدام التقليم أو الكمّ أو تقنيات تقطير المعرفة، مما يجعلها أسرع ولكن أحيانًا أقل دقة وأقل موثوقية. يسلك HALL-OPT مسارًا مختلفًا: يدمج وعيًا بالهلوسة مباشرة في بنية النموذج الداخلية ويستخدم تلك الإشارات نفسها ليقرر ما الذي يحسبه وما الذي يتجنبه. بدلاً من إضافة فحوصات إضافية أو تقليص الشبكة بلا تمييز، ينسّق بين الموثوقية والسرعة في إطار عمل واحد مُصمَّم لأجهزة الحافة.

كيف يصفّي النظام المحتوى عالي المخاطر

في قلب HALL-OPT يوجد وحدة انتباه وعيّة بالهلوسة تراقب كيف يوزّع النموذج تركيزه عبر الكلمات ومدى ثقته في تنبؤاته. عندما يكون الانتباه مشتتًا أو الثقة منخفضة، أو عندما تتعارض دلالة رمز (توكن) ما مع السياق المحيط، يُعطى ذلك الرمز درجة «مخاطرة» أعلى. ثم يعلّم كاشف ذو مسارين هذه القطع عالية المخاطرة كاحتمالات للهلوسة. يستخدم النموذج هذه الإشارات لتشغيل مرحلة تقليم ديناميكي: تُزال الرموز التي تحمل قيمة منخفضة ومخاطرة عالية، بينما تُحتفظ بالرموز المهمة والموثوقة. يقلل ذلك عدد العناصر التي يجب على النموذج معالجتها في كل طبقة، مقلصًا التكلفة التربيعية المكثفة للاهتمام دون فقدان المعنى الأساسي للنص.

حشو نموذج كبير داخل نموذج صغير وفعّال

لتحقيق سلوك قوي داخل حزمة أصغر، يطبّق HALL-OPT تقطير المعرفة، حيث يُدرِّب نموذج "معلم" كبير نموذج "طالب" مدمج. على عكس التقطير القياسي، يُعلَّم الطالب ليس فقط لمطابقة إجابات المعلم بل أيضًا لتقليد حسّه بمواضع احتمال الخطأ. تدريب إضافي يدفع الطالب لتجنّب التنبؤات المفرطة الثقة والمعرضة للهلوسة. أخيرًا، يحضّر طبقة تحسين الحافة النموذج للحساب منخفض الدقة، محوِّلةً أوزانه إلى قيم 8-بت وإعادة هيكلة العمليات الحسابية لتتناسب مع أجهزة الحافة الحقيقية مثل لوحات NVIDIA Jetson ووحدات TPU من Google Coral. تحفظ هذه المجموعة معظم الدقة الأصلية مع تقليل حاد في استخدام الذاكرة، استهلاك الطاقة، وزمن الاستجابة.

Figure 2
الشكل 2.

الأثر الواقعي على السرعة والطاقة والسلامة

تُظهر الاختبارات على معيارين صارمين — أحدهما للإجابة عن الأسئلة مع أسئلة مخادعة لا يمكن الإجابة عليها، والآخر لتلخيص الأخبار — أن HALL-OPT يكتشف الهلوسات بدقة تقارب 94% ويحافظ على أداء المهام قريبًا من نموذج BERT القياسي. وفي الوقت نفسه، يقلل زمن الاستدلال بنحو ثلثي الوقت ويخفض استهلاك الطاقة بحوالي 40% أو أكثر عند حساب المتوسط عبر أحمال عمل واقعية. على أجهزة الحافة، غالبًا ما يستجيب في أقل من 50 ملِّي ثانية ويستخدم ذاكرة أقل بكثير. تؤكد اختبارات الإجهاد عبر منصات وسيناريوهات صناعية، من المصانع الذكية إلى مراقبة الرعاية الصحية، أن النظام يحافظ على توقيت متنبأ ومعدل «استدلالات لكل واط» ملائم، مما يجعله مناسبًا للاستخدام المستمر وفي الوقت الفعلي.

ما يعنيه هذا للذكاء الاصطناعي اليومي

لغير المتخصصين، الرسالة الأساسية هي أننا لسنا مضطرين للاختيار بين ذكاء اصطناعي سريع وذكاء اصطناعي موثوق على الأجهزة الصغيرة. من خلال تعليم النموذج على التعرف على نقاط ضعفه والسماح لهذا الوعي بتوجيه مقدار ما يحسبه، يقدم HALL-OPT استجابات سريعة وأقل عرضة للاختلاق. يجعل ذلك منه عمودًا واعدًا لتطبيقات الحافة المستقبلية حيث قد تكون الإجابات الخاطئة أو ردود الفعل البطيئة ذات عواقب خطيرة، مثل توجيه مركبة، التحكم في آليات صناعية، أو التنبيه لتغيّرات حرجة في حالة المريض.

الاستشهاد: Algawiaz, D. Hallucination-aware learning and latency optimization transformer (HALL-OPT) for real-time edge intelligence. Sci Rep 16, 12245 (2026). https://doi.org/10.1038/s41598-026-42981-3

الكلمات المفتاحية: الذكاء الاصطناعي على الحافة, كشف الهلوسة, نماذج المحول, الاستدلال في الوقت الفعلي, حوسبة موفِّرة للطاقة