Clear Sky Science · ar

تقديرات موثوقة لعدم اليقين في التعلم العميق باستخدام خوارزميات ميتروبوليس-هاستينغز الفعالة

· العودة إلى الفهرس

لماذا يهم عدم اليقين الأذكى

من صور الأشعة الطبية إلى السيارات ذاتية القيادة، كثيرًا ما تتخذ نظم الذكاء الاصطناعي الحديثة قرارات حيث يمكن أن يكون الخطأ الواثق مضرًا. أنظمة التعلم العميق التقليدية ممتازة في التعرف على الأنماط، لكنها سيئة الشهرة في إعلامنا بدرجة عدم اليقين لديها. يتناول هذا البحث تلك الفجوة: يقدم طرقًا جديدة لتزويد الشبكات العصبية العميقة بمقاييس موثوقة لعدم اليقين، مع الحفاظ على حمل الحساب الثقيل لأساليب بايز التقليدية تحت السيطرة.

Figure 1
Figure 1.

من التخمين إلى الثقة المقاسة

في ممارسات التعلم العميق اليومية، يتم تدريب النموذج مرة واحدة ثم يُستخدم كما هو. يعطي تخمينًا واحدًا أفضل، لكنه لا يقدم رؤية كبيرة حول مدى موثوقية هذا التخمين. تتخذ الشبكات العصبية البايزية مسارًا مختلفًا: بدلًا من تثبيت مجموعة واحدة من معاملات النموذج، تعامل المعاملات كمتغيرات عشوائية وتحاول تمثيل توزيع كامل من النماذج المحتملة. يمكن أن يكشف التوسيط عبر تلك المجموعة عن الإجابة المرجحة ومدى ثقة النموذج في نفسه. التحدي هو أن أخذ عينات دقيقة من هذا التوزيع باستخدام أساليب المعيار الذهبي مثل مونت كارلو الهاميلتوني مكلف للغاية لشبكات وبيانات اليوم الكبيرة.

تسريع العينة دون فقدان الصورة الكبرى

يركز المؤلفون على عائلة من الأساليب تُدعى مونت كارلو الهاميلتوني بتدرج عشوائي، التي تعيد بالفعل استخدام أفكار من التدريب القياسي—مثل الدفعات الصغيرة والتدرجات الصاخبة—لتسريع أخذ العينات. العنصر المفقود هو «مرشح» موثوق يقرر أي تحديثات المعاملات المحتملة يستحق الاحتفاظ بها. في مونت كارلو الهاميلتوني الكلاسيكي، يؤدي خطوة قبول ميتروبوليس-هاستينغز هذا الدور لتصحيح الأخطاء العددية ومنع العينة من الانجراف إلى مناطق خاطئة. إدخال خطوة القبول هذه إلى عالم التعلم العميق ذو الدفعات الصغيرة والتدرجات الصاخبة صعب، لأنها عادةً تتطلب تقييمات على كامل مجموعة البيانات وقد تعوق التقدّم إذا كانت معدلات القبول منخفضة جدًا.

طريقتان جديدتان للتجوال في المشهد

يقدم البحث استراتيجيتين تكميليتين. الأولى، المسماة مونت كارلو الهاميلتوني بتدرج عشوائي المعمم (GSGHMC)، تصمم اختبار قبول يعمل على الدفعات الصغيرة مع الحفاظ على الخاصية المهمة بأن الأمثل الحقيقية للمشكلة الكاملة ما زالت معروفة بشكل صحيح. تستخدم متكاملًا عدديًا مُختارًا بعناية بحيث يظل القبول خطوة بخطوة مستقرًا، رغم أنه يرى شريحة من البيانات في كل مرة. هذا يعطي عينة فعالة تبقى قريبة من الصورة البايزية الحقيقية وتنتج تجمعات من النماذج ذات درجات ثقة معايرة بشكل جيد بشكل خاص.

Figure 2
Figure 2.

ركوب المسارات الطويلة لتنبؤات أفضل

الطريقة الثانية، تجمع المسارات الهاميلتونية (HTE)، تقوم بمقايضة متعمدة: بدلًا من الإصرار على سلوك بايزي دقيق، تفضّل تجوالات طويلة مدفوعة بالزخم عبر فضاء المعامل تشبه جولات تدريب هجومية. في نهاية كل مسار من هذا النوع، يقرر اختبار على غرار ميتروبوليس ما إذا كان يجب الاحتفاظ بلقطة النموذج الناتجة. لأن هذه المسارات تميل إلى الاستقرار في وديان واسعة وقابلة للتعميم من مشهد الخسارة، فإن النماذج المجمعة تشكل تجمُّعًا متنوعًا لكن مركزًا. في معايير تصنيف الصور مثل EMNIST وCIFAR-10، يحسّن HTE الدقة بما يصل إلى نحو ست نقاط مئوية على قواعد بايز قوية، وبعدة نقاط على التدريب الحتمي العادي، مع تقديم معلومات مفيدة عن عدم اليقين وقدرة قوية على اكتشاف المدخلات خارج التوزيع.

تجمعات أصغر، استخدام أذكى

يبدو أن أخذ عينات لمئات أو آلاف النماذج مكلف عند الاختبار، لذا يدرس المؤلفون أيضًا عدد أعضاء التجمع اللازم فعلاً. من خلال التخلص بطمع من النماذج التي لها تأثير ضئيل على الأداء، يجدون أنه يمكن غالبًا الاحتفاظ بنحو ثلث التجمع دون الإضرار بالدقة، رغم أن الحفاظ على معايرة حادة جدًا يتطلب عادةً مزيدًا من الأعضاء. عبر مهام الصور ومسألة توقع سلسلة زمنية فوضوية، تتفوق منهجياتهم باستمرار أو تساوي البدائل الشائعة مثل الاستدلال التغييري، دروب آوت مونت كارلو، وتجميعات عميقة أبسط، وإن كان ذلك بتكلفة تدريب أعلى من التعلم الحتمي البسيط.

ماذا يعني هذا للذكاء الاصطناعي في العالم الحقيقي

بالنسبة لغير المتخصص، الرسالة الأساسية هي أنه يمكننا جعل التعلم العميق ليس فقط دقيقًا بل صادقًا أيضًا بشأن ما لا يعرفه، دون الحاجة إلى موارد بحجم الحواسيب الفائقة. من خلال نسج أفكار العينة الكلاسيكية بعناية في التدريب الحديث القائم على الدفعات الصغيرة، تقدم الطريقتان المقترحتان تنبؤات أفضل وتقديرات ثقة أكثر موثوقية من العديد من التقنيات الموجودة. هذا الجمع بين الكفاءة والمتانة وعدم اليقين المعاير يعد خطوة رئيسية نحو نشر التعلم العميق بأمان في المجالات الحساسة حيث يمكن قياس تكلفة الثقة المفرطة بالأرواح، لا بالنقاط المئوية فحسب.

الاستشهاد: Schmal, M., Mäder, P. Reliable uncertainty estimates in deep learning with efficient Metropolis-Hastings algorithms. Nat Commun 17, 2531 (2026). https://doi.org/10.1038/s41467-026-70015-z

الكلمات المفتاحية: الشبكات العصبية البايزية, تقدير عدم اليقين, مونت كارلو الهاميلتوني, تجمعات التعلم العميق, مونت كارلو بتدرج عشوائي