Clear Sky Science · ar

ثبات ومتانة مجموعات الاقتراع التفسيرية ذات الأغلبية الدنيا

· العودة إلى الفهرس

لماذا تهم نماذج الاقتراع الصغيرة

عندما تساعد الحواسيب في تقرير من يحصل على قرض، أو أي فحص طبي يجب إجراؤه، أو كيفية فرز الاحتيال، يريد الناس فهم الأسباب وراء كل قرار. فكرة شائعة هي استخدام نماذج صغيرة جدًا مكوّنة من قواعد بسيطة بنعم أو لا تصوّت على الإجابة. هذه النماذج سهلة القراءة، لكن الدراسة وراء هذا المقال تطرح سؤالًا أعمق: إذا أصررنا على أصغر مجموعة قواعد ممكنة، هل نحصل على تفسيرات هشة تتغير بسهولة عندما تتعرض البيانات لاضطراب؟

قواعد الاقتراع البسيطة بلغة واضحة

تفحص الورقة أنظمة قائمة على القواعد الصغيرة المعروفة بتجميعات تصويت الأغلبية. تنظر كل قاعدة إلى ميزة بنعم أو لا، مثل ما إذا كانت قيمة تتجاوز عتبة، وتدلي بصوت لصالح أحد نتيجتين. القرار النهائي ينبع من أغلبية هذه الأصوات. يركز المؤلفون على النماذج الحدّية، أي التي تستخدم أقل عدد من القواعد اللازم لتطابق بيانات التدريب. مثل هذه النماذج جذابة للغاية من حيث الشرح، لأن إنسانًا يمكنه، من حيث المبدأ، قراءة كل القواعد وفهم كيفية اتخاذ القرارات.

العديد من الإجابات الصغرى المختلفة

مع ذلك، غالبًا ما تسمح البيانات الحقيقية بأكثر من نموذج صغير واحد. يبين الفريق أنه قد توجد مجموعات قواعد دنيا عديدة مختلفة تتطابق كلها مع نفس البيانات تمامًا، وهو وضع يُسمى أحيانًا تأثير راشومون. لدراسة هذا، يقترحون ثلاثة قياسات. أولًا، معدل التعددية يحسب عدد المرات التي يوجد فيها أكثر من نموذج حدّ أدنى واحد لمجموعة بيانات. ثانيًا، اختبار ثبات التمهيد (bootstrap) يتحقق من مدى تشابه النماذج الحدّية المُنتقاة عندما تُعاد عيّنات البيانات قليلًا. ثالثًا، متانة تبديل الميزات تختبر مدى متانة النموذج المختار عندما تُقلب بتات الإدخال الفردية عشوائيًا، محاكاةً لبيانات ضوضائية أو متغيرة.

Figure 1. من بيانات معقدة إلى مجموعة مدمجة من قواعد التصويت التي تتخذ قرارًا مفهومًا معًا.
Figure 1. من بيانات معقدة إلى مجموعة مدمجة من قواعد التصويت التي تتخذ قرارًا مفهومًا معًا.

ما تكشفه التجارب الدقيقة

باستخدام مجموعات بيانات تركيبية خاضعة للرقابة، يزرع المؤلفون نموذج تصويت معروفًا ثم يحاولون استرداد نماذج حدّية من عينات صغيرة. يجدون أن الدقة على بيانات اختبار نظيفة يمكن أن تكون مرتفعة حتى عندما يكون الاستقرار ضعيفًا. مع عدد قليل جدًا من أمثلة التدريب، تظهر العديد من النماذج الحدّية المختلفة، وتتداخل مجموعات القواعد المختارة من إعادة عيّنة إلى أخرى بشكل ضئيل إلى متوسط. مع زيادة حجم العيّنات، تتضاءل هذه الحالات غير المستقرة: ينخفض التعدد، ويزداد ثبات التمهيد، وتتحسن المتانة ضد تبديلات الميزات. عند أحجام عينات متوسطة، يطابق النموذج الحدّي المستعاد النموذج المغروس تقريبًا، وجمع المزيد من البيانات يمنح مكاسب صغيرة فقط.

مجموعات بيانات حقيقية وخيارات عملية

تتجه الدراسة بعد ذلك إلى مجموعات بيانات كلاسيكية في التعلم الآلي من مجالات مثل تشخيص السرطان والتحقق من أوراق نقدية. لأن المطابقة التامة مع مجموعات قواعد صغيرة ليست ممكنة دائمًا، يرخّص المؤلفون الهدف لتحقيق دقة تدريب مختارة على الأقل ثم يبحثون عن أصغر النماذج التي تفي بهذا الحد. يجدون أن بعض مجموعات البيانات تدعم مجموعات حدّية مستقرة للغاية، بينما تُظهر أخرى عدم استقرار واضحًا وحساسية للضوضاء. تشديد متطلبات الدقة يجعل النماذج أقل استقرارًا وأحيانًا يستحيل العثور عليها. لمعالجة هذا، يختبر المؤلفون قواعد اختيار ما زالت تُفضّل النماذج الصغيرة لكن تختار، من بين جميع النماذج الحدّية، تلك التي تظهر في أغلب عمليات التمهيد أو التي تكون أكثر متانة أمام تبديلات الميزات. هذه الاستراتيجيات تضحي قليلًا من الدقة الخام مقابل تفسيرات أكثر قابلية للتكرار والاعتماد.

Figure 2. تغييرات طفيفة في البيانات تختار مجموعات قواعد تصويت صغيرة مختلفة، ما يغيّر القرارات ما لم نفضّل النماذج الأكثر استقرارًا.
Figure 2. تغييرات طفيفة في البيانات تختار مجموعات قواعد تصويت صغيرة مختلفة، ما يغيّر القرارات ما لم نفضّل النماذج الأكثر استقرارًا.

لماذا هذا مهم في قرارات عالية المخاطر

بالنسبة للأشخاص الذين يعتمدون على نماذج شفافة في مجالات حساسة، الرسالة المركزية هي أن «الأصغر» لا يعني دائمًا «الأأمن». قد تروي مجموعتا قواعد صغيرتان متساويتان قصتين مختلفتين عن سبب اتخاذ القرار وقد تتصرفان بشكل مختلف أمام تغييرات طفيفة في المدخلات. يبيّن المؤلفون أنه من العملي قياس مدى ثبات ومتانة مثل هذه النماذج وأن الإبلاغ عن هذه المقاييس إلى جانب حجم النموذج يمكن أن ينبه المستخدمين عندما تكون التفسيرات هشة. باختصار، عند بناء نماذج اقتراع بسيطة لقرارات عالية المخاطر، ينبغي أولًا السعي إلى التضييق ثم تفضيل النسخ التي تتصرف بثبات عبر إعادة العيّنات أو البيانات المُنمّقة قليلًا.

الاستشهاد: Li, Q., Huang, Z. & Pan, M. Stability and robustness of minimal majority vote interpretable ensembles. Sci Rep 16, 14877 (2026). https://doi.org/10.1038/s41598-026-45289-4

الكلمات المفتاحية: نماذج قابلة للتفسير, تصويت بالأغلبية, ثبات النموذج, المتانة, تأثير راشومون