Clear Sky Science · ar
معايرة المصنّفات العميقة عبر نشر الثقة الديناميكي والتطبيع التكيفي
لماذا يهم الوثوق بثقة الذكاء الاصطناعي
لا تكتفي أنظمة الذكاء الاصطناعي الحديثة بإخبارنا بما تعتقد أنه في صورة أو في قراءة مستشعر—بل تعطي أيضًا مدى يقينها. تُعد هذه الثقة المُبلغ عنها ذاتيًا حاسمة في سياقات تتطلب السلامة مثل التصوير الطبي والقيادة الذاتية والمراقبة الصناعية، حيث قد يكون الإحساس الخاطئ باليقين خطيرًا. ومع ذلك، تشتهر الشبكات العصبية العميقة اليوم بكونها مفرطة الثقة في أخطائها، والحلول الحالية غالبًا ما تنهار عندما تكون البيانات غير متوازنة أو تأتي من بيئات متغيرة. يقدم هذا البحث طريقة جديدة، تُسمى نشر الثقة الديناميكي مع التطبيع المتناوب (DCP‑AN)، مصممة لجعل درجات ثقة أنظمة الذكاء الاصطناعي أكثر صدقًا واستقرارًا وكفاءة في ظروف واقعية ومتغيرة.

عندما تكون الآلات الذكية واثقة من نفسها أكثر من اللازم
تُدرّب معظم نماذج التعلم العميق الشائعة للتنبؤ بالتصنيف الصحيح، وليس لتقييم مدى موثوقية كل تنبؤ. ونتيجة لذلك، قد تكون الشبكة «متأكدة» بنسبة 99% أن صورة تُظهر قطة بينما تكون في الواقع كلبًا. تحاول تقنيات المعايرة القياسية، مثل مقياس الحرارة أو تقسيم التنبؤات إلى صناديق ثقة، إصلاح هذا بعد التدريب عبر تطبيق تعديلات عامة. ومع ذلك، تتعامل هذه الأساليب مع جميع الفئات وكل الأمثلة بنفس الطريقة. في العالم الحقيقي، نادرًا ما تكون البيانات متوازنة: فهناك بعض الفئات الشائعة «الرأسمالية» التي تحتوي على الكثير من الأمثلة، في حين أن الفئات النادرة «الذيول» قد تظهر مرات قليلة فقط. تميل الشبكات إلى أن تكون مفرطة الثقة في الفئات الشائعة وقليلة الثقة في الفئات النادرة، وهو فارق لا تستطيع التصحيحات الثابتة والشاملة سدّه—وخاصة عندما يتغير توزيع البيانات عبر النطاقات، مثل من الرسومات الفنية إلى الصور الحقيقية.
طريقة جديدة لمشاركة المعلومات بين البيانات والتسميات
يتصدى DCP‑AN لهذه المشكلة عن طريق نمذجة كيفية تدفق الثقة بين العينات الفردية والفئات التي تنتمي إليها بشكل صريح. تمثل الطريقة العلاقة بين العينات والفئات كشبكة ذات طبقتين: طبقة عُقد للعينات وطبقة للفئات، مرتبطة باتصالات موزونة تُشفّر قوى التنبؤ الأولية. ثم تُنقح الثقة من خلال روتين ذي خطوتين. في الخطوة الأولى، يتدفق المعلومات من العينات إلى الفئات، مُعدِّلةً مدى تشتُّت تنبؤات كل فئة، مُسترشدةً بمدى عدم اليقين الذي تبدو عليه تلك الفئة حاليًا. في الخطوة الثانية، يتدفق المعلومات عائدًا من الفئات إلى العينات، دافعةً ملف ثقة كل عينة استنادًا إلى مدى اتساقه مع التقديرات السابقة. من خلال تكرار هذا التبادل ذهابًا وإيابًا لعدد محدود من المرات، يشجّع النظام «التعاون» بين الأمثلة والتسميات، بحيث تتلقى الفئات النادرة إشارات أوضح بدل أن تطغى عليها الفئات الشائعة.
رفع الحرارة حيثما يلزم
ابتكار رئيسي في DCP‑AN هو «حقل درجة الحرارة» التكيفي الذي يغيّر مدى قوة الطريقة في إعادة تشكيل الثقة اعتمادًا على مدى عدم اليقين محليًا وعالميًا. بدلًا من استخدام قيمة درجة حرارة واحدة لكل التنبؤات، تُحسب قوتا التعديل بصورة منفصلة للفئات وللعينات، استنادًا إلى مقاييس عدم اليقين وعدم التوافق مع مرور الزمن. بالنسبة للفئات الرأسمالية التي تتعامل الشبكة معها بثقة بالفعل، تبرد درجة الحرارة الفعّالة بلطف، مانعةً الانسلاخ المفرط ومحافظةً على الفواصل الحادة. بالنسبة للفئات النادرة والعينات المبهمة، ترتفع درجة الحرارة، مما يسمح بتصحيحات أقوى ترفع من ثقتها عندما يكون ذلك مبررًا وتُخمّد الذروات الزائفة. ينبثق هذا السلوك الديناميكي من قاعدة تحديث مبدئية، ويُظهر استجابة سريعة عندما يزداد عدم اليقين، بينما يظل مستقرًا عندما يكون النموذج بالفعل متوافقًا جيدًا.

تحسّن موثوق عبر مهام ومعدات
يقيم المؤلفون DCP‑AN بعناية على عدة مجموعات صور مستخدمة على نطاق واسع. على نسخة طويلة الذيل من ImageNet، حيث تحتوي بعض الفئات على مئات الأضعاف من الصور مقارنة بغيرها، تعزّز الطريقة الدقة في الفئات النادرة بحوالي 10 نقاط مئوية مطلقة وتقلّص مقياس خطأ المعايرة القياسي بأكثر من النصف مقارنةً بخط الأساس غير المصحَّح. في اختبار عبور نطاقات ينقل نموذجًا مدرّبًا على الأعمال الفنية إلى صور العالم الحقيقي، يزيد DCP‑AN الدقة في النطاق الجديد ويقلّص مقياسًا إحصائيًا للفجوة بين بيانات المصدر والهدف. ومن المهم أن تتحقق هذه المكاسب دون تكلفة حسابية كبيرة: عند التشغيل على وحدة رسوميات حديثة، تضيف الطريقة أكثر قليلاً من جزء من الألف من الثانية من التأخير وأقل من نصف ميغابايت من الذاكرة الإضافية، مما يجعلها عملية لأجهزة الوقت الحقيقي والأطراف (edge).
ما يعنيه ذلك للذكاء الاصطناعي في الحياة اليومية
بعبارات بسيطة، يبيّن هذا العمل أننا نستطيع جعل أنظمة الذكاء الاصطناعي ليست أكثر ذكاءً فحسب، بل أكثر وعيًا بذاتها بشأن متى قد تكون مخطئة. من خلال السماح لتدفق معلومات الثقة أن يسير ذهابًا وإيابًا بين الأمثلة والفئات، وبالتكيّف في مدى حدة التصحيح اعتمادًا على تغيرات عدم اليقين، يوفّر DCP‑AN تقديرات احتمالية تطابق الواقع بشكل أفضل—حتى للأحداث النادرة وعبر البيئات المتغيرة. وبما أنه يأتي بضمان رياضي بأن تحديثاته التكرارية تستقر بسرعة، ولأنه يعمل بعبء إضافي ضئيل، يمكن إدراج هذا الإطار في الشبكات العصبية الحالية في مجالات مثل الرعاية الصحية والروبوتات ومراقبة الأمن. النتيجة هي ذكاء اصطناعي لا يزال يرتكب أخطاء، لكنه أكثر صدقًا بشأن مدى يقينه—وهي خطوة حاسمة نحو أنظمة يمكن للناس الاعتماد عليها بأمان.
الاستشهاد: He, P., Fu, W., Wang, L. et al. Calibrating deep classifiers with dynamic confidence propagation and adaptive normalization. Sci Rep 16, 10959 (2026). https://doi.org/10.1038/s41598-026-39842-4
الكلمات المفتاحية: معايرة الثقة, الشبكات العصبية العميقة, التعرف طويل الذيل, تقدير عدم اليقين, تكيّف النطاق