Clear Sky Science · ar
تقدير نسبة الأرجحية من درجات مخرجات نماذج التعلم الآلي: الإمكانيات والقيود
لماذا يهم ذلك للصحة والذكاء الاصطناعي
يتجه الأطباء وباحثو الصحة العامة بشكل متزايد إلى الذكاء الاصطناعي لاكتشاف كيف تؤثر العوامل البيئية، مثل الحرارة أو تلوث الهواء، على صحتنا. لكن بينما تكون أدوات التعلم الآلي الحديثة قوية في التنبؤ بمن قد يمرض، فإنها غالباً ما تفشل في الإجابة عن سؤال أكثر أساسية يهم الأطباء وصانعي السياسات: ما مقدار زيادة أو انخفاض الخطر الناتج عن تعرض معيّن؟ تتناول هذه الدراسة هذه الفجوة من خلال إظهار كيفية تحويل مخرجات نماذج التعلم الآلي الشبه غامضة إلى نسب الأرجحية المألوفة التي تقوم عليها كثير من قرارات الطب وعلم الأوبئة.

من درجات الصندوق الأسود إلى مخاطر قابلة للفهم
في علم الأوبئة التقليدي، تربط طريقة راسخة تسمى الانحدار اللوغيستي التعرض (على سبيل المثال الطقس البارد) بنتيجة صحية (مثل دخول المستشفى) مع التحكم بعوامل أخرى مثل العمر أو التلوث. قوتها الرئيسية هي القابلية للتفسير: فهي تعطي مباشرة نسبة الأرجحية، التي تخبرنا كم مرة تزيد (أو تنخفض) احتمالية المرض في مجموعة مقارنة بأخرى. يمكن لأساليب التعلم الآلي الحديثة مثل الغابات العشوائية والتدرج المعزز أن تلتقط أنماطًا أكثر تعقيدًا في البيانات، لكنها عادةً ما تعيد درجات لا تملك معنى مباشراً للمخاطر، مما يصعّب الإبلاغ عن النتائج بلغة يثق بها الأطباء. سعى المؤلفون لربط هذين العالمين.
طرق جديدة لقراءة المخاطر من نماذج التعلم الآلي
اقترح الباحثون عشر طرق مختلفة لاسترداد نسب الأرجحية من الدرجات التي تنتجها مصنفات التعلم الآلي. يبدأ ثمانية من هذه التقديرات «الهجينة» من درجات النموذج الخام أو المعايرة — أرقام بين الصفر والواحد تعكس مدى احتمالية إصابة كل شخص بالنتيجة — ثم تضرب ملخصًا بسيطًا لتلك الدرجات بعامل تعديل مستمد من نموذج الانحدار اللوغيستي التقليدي. يأخذ هذا العامل بعين الاعتبار الفروق في العمر والموسم والمتغيرات الخلفية الأخرى بين مجموعات المعرضين وغير المعرضين. وتعتمد تقديران إضافيان على دوال الاعتماد الجزئي، وهي أداة تسأل، فعليًا، «ماذا سيتنبأ النموذج لو أن الجميع لديهم مستوى التعرض A مقابل المستوى B، بينما بقي كل شيء آخر كما لوحظ؟» من خلال مقارنة هذه التنبؤات، يحصل المؤلفون على نسبة أرجحية مؤسَّسة على النموذج تعكس رؤية نموذج التعلم الآلي للبيانات.
اختبار الطرق على مسائل صحية حقيقية
للاطلاع على مدى فاعلية هذه الأفكار، طبّق الفريق هذه الطرق على ثلاثة نماذج — الانحدار اللوغيستي والغابة العشوائية والتدرج المعزز — على مجموعتي بيانات وبائيتين كبيرتين من إسرائيل. تابعت إحداهما البالغين الأكبر سنًا الذين نُقلوا إلى المستشفى لمشكلات تنفسية أو قلبية وعائية، مع التركيز على ما إذا كانت درجات الحرارة المنخفضة غير المعتادة تزيد من احتمال الدخول للمستشفى. وتتبع الأخرى أكثر من 160,000 رضيع لفحص ما إذا كانت درجات الحرارة المرتفعة أثناء الحمل مرتبطة بزيادة الوزن في سن الثانية. لكل تركيبة من مجموعة البيانات والنموذج، حسبوا عشرة تقديرات لنسب الأرجحية وفترات عدم اليقين الخاصة بها، وقارنوا النتائج مع تلك الناتجة عن الانحدار اللوغيستي القياسي، معاملة إياه كمرجعية عملية.

أي أدوات التعلم الآلي أدت بشكل أفضل
كانت خطوة رئيسية في الدراسة هي «المعايرة» — إعادة تشكيل درجات نماذج التعلم الآلي الخام بحيث، على سبيل المثال، من بين الأشخاص الذين أُعطي لهم خطر 20%، يكون نحو واحد من كل خمسة ممن لديهم النتيجة فعلًا. اختبر المؤلفون ثلاث طرق معايرة شائعة ووجدوا أن تقنية بسيطة تسمى الانحدار الأزوتمي غالبًا ما قربت درجات الغابة العشوائية والتدرج المعزز إلى احتمالات جيدة السلوك. عندما وُضعت هذه الدرجات المعايرة في تقديرات نسب الأرجحية، ظهر نمط مهم: تميل نسب الأرجحية المشتقة من التدرج المعزز إلى التوافق جيدًا مع تلك الناتجة عن الانحدار اللوغيستي، حيث وقع نحو 87% من التقديرات داخل نطاق الثقة 95% لنموذج اللوغيستيك وغالبًا ما أنتجت فترات عدم يقين أضيق قليلاً. على النقيض من ذلك، أظهرت الغابات العشوائية سلوكًا متقلبًا — انهارت العديد من التنبؤات إلى 0 أو 1، مما جعل عدة تقديرات لنسب الأرجحية غير مستقرة أو مضللة، حتى بعد المعايرة.
ما معنى ذلك لاستخدام الذكاء الاصطناعي في الصحة العامة
تظهر الدراسة أنه من الممكن الاستفادة من القدرة التنبؤية لنماذج التعلم الآلي الحديثة دون التضحية بالقدرة على التفسير، على الأقل تحت ظروف شائعة في بحوث الصحة البيئية. عند اقترانها بمعايرة دقيقة والتقديرات المقترحة، يمكن لنماذج التدرج المعزز أن توفر نسب أرجحية قابلة للمقارنة، وأحيانًا أكثر دقة، من تلك الناتجة عن الانحدار اللوغيستي الكلاسيكي. ومع ذلك، ليست كل خوارزميات التعلم الآلي مناسبة بنفس القدر لهذه المهمة: قد تتطلب الغابات العشوائية، على وجه الخصوص، حذرًا إضافيًا أو استراتيجيات بديلة عند استخدامها لتقدير أحجام التأثير. بالنسبة لصانعي السياسات والأطباء، الخلاصة الأساسية هي أن طرق الذكاء الاصطناعي المتقدمة لا يجب أن تظل صناديق سوداء — إذا استخدمت بعناية، يمكن أن تنتج قياسات واضحة ومألوفة للمخاطر تدعم اتخاذ القرارات في العالم الحقيقي.
الاستشهاد: Nirel, R., Bauman, N., Morin, E. et al. Estimating the odds ratio from the output scores of machine learning models: possibilities and limitations. Sci Rep 16, 8922 (2026). https://doi.org/10.1038/s41598-026-38150-1
الكلمات المفتاحية: نسبة الأرجحية, التعلم الآلي, علم الأوبئة, تقدير المخاطر, درجة الحرارة والصحة