Clear Sky Science · ar
تقليل الميزات باستخدام تحسين السرب ومصنّفات الغابة العشوائية للتنبؤ المبكر بمخاطر السكري
لماذا يهم اكتشاف السكري مبكرًا
في العادة يتسلل داء السكري من النوع الثاني بهدوء، مسببًا أضرارًا في القلب والعينين والكليتين والأعصاب قبل تشخيصه بوقت طويل. يعتمد الأطباء عادةً على العديد من الأسئلة والاختبارات لتقييم خطر الشخص، ما قد يستغرق وقتًا لكل من المرضى والعيادات. تستقصي هذه الدراسة كيف يمكن لبرامج حاسوبية ذكية أن تكشف عن مخاطر السكري المبكرة باستخدام عدد قليل من الأسئلة البسيطة بنعم أو لا، ما قد يجعل الفحص أسرع وأرخص وأسهل للتطبيق في بيئات مزدحمة أو محدودة الموارد. 
قائمة تحقق أكثر ذكاءً لمخاطر السكري
عمل الباحثون مع مجموعة بيانات من عالم الواقع من مستشفى لمرضى السكري في سيلهيت، بنغلاديش. وكل من الـ520 شخصًا في مجموعة البيانات وُصِف على أنه إما مصاب بالسكري في مرحلة مبكرة أو غير مصاب. لكل شخص، سجّل الأطباء العمر و15 علامة وأعراضًا سريرية بسيطة، مثل التبول المتكرر (تعدد البول)، العطش الشديد (تعدد العطش)، فقدان الوزن المفاجئ، الحكة، الرؤية الضبابية، والسمنة. كانت معظم الإجابات عبارة عن نعم أو لا في استبيان، مما يجعل البيانات مماثلة لما يمكن للممرضة أو العامل الصحي جمعه في دقائق أثناء زيارة روتينية.
تعليم الحاسوب للتركيز على ما يهم أكثر
بدلًا من إدخال كل المعلومات الست عشرة إلى نموذج بشكل افتراضي، طرح الفريق سؤالًا رئيسيًا: أي من هذه الميزات تحمل في الواقع أكبر قدر من المعلومات عن خطر السكري؟ للإجابة، جمعوا طريقة تعلم آلي شهيرة تُدعى الغابة العشوائية مع ثلاث استراتيجيات بحث "سربية" مستوحاة من سلوك الحيوانات: مُحسّن الثعلب، خوارزمية حيوان العوراء (honey badger)، وتحسين سرب التونة. تتصرف هذه الأسراب كصيادين رقميين، تتجول عبر العديد من تركيبات الميزات وإعدادات النموذج لإيجاد تلك التي تمنح أفضل تنبؤات بأقل مدخلات. كرّر النظام تقسيم البيانات إلى أجزاء تدريب واختبار، وضبط إعداداته الداخلية، وصوّت على الميزات وقيم المعلمات التي أدت أفضل عبر عدة تشغيلات.
مدى أداء النماذج المبسطة
النماذج الثلاثة الناتجة—التي سُمّيت FOX_RF وHBA_RF وTSO_RF—كانت كلها دقيقة للغاية. عند تدريبها واختبارها مرة واحدة على مجموعة البيانات الكاملة، صنّف نموذج التونة (TSO_RF) كل الأشخاص بشكل صحيح، محققًا دقة ومقاييس دقة واسترجاع 100%. وعندما استخدم المؤلفون تقييمًا أكثر صرامة بتقاطع احتراز 10 طيات، الذي يحاكي الاختبار على بيانات غير مرئية، حافظ TSO_RF على متوسط دقة أعلى من 98%، متفوقًا قليلاً على النموذجين الآخرين وكذلك على تقنيات منشورة سابقة على نفس مجموعة البيانات. والأهم من ذلك، أن نموذج الـhoney-badger حقق أداءً قويًا مستخدمًا فقط 10 من أصل 16 ميزة، بينما احتاجت النماذج الأخرى فقط إلى 13 أو 14 ميزة. يعني هذا الاختزال أسئلة أقل للمرضى وحِسابه أخف لأي تطبيق أو جهاز مستقبلي. 
نظرة داخل الصندوق الأسود
غالبًا ما تعمل أنظمة التنبؤ الحديثة جيدًا لكنها صعبة التفسير. لمواجهة ذلك، استخدم الباحثون طريقة تشرح الذكاء الاصطناعي تُدعى SHAP لقياس مدى دفع كل ميزة النموذج نحو التنبؤ بالسكري أو بعدم وجوده لكل فرد. عبر النماذج الثلاثة، ظهر نفس النمط: التبول المتكرر، العطش الشديد، والجنس كان لها التأثير الأقوى باستمرار على التنبؤات، مع أن فقدان الوزن المفاجئ، تيبس العضلات، العصبية، وبعض العلامات الأخرى لعبت أدوارًا داعمة. كما فحص الفريق الأخطاء المحددة—الحالات التي أخطأت فيها النماذج في التصنيف—وأظهروا أن تغييرات صغيرة في هذه الأعراض الرئيسية غالبًا ما قلبت القرار، كاشفةً أين تكون النماذج أكثر حساسية وأين يجب أن يكون الأطباء حذرين.
ما معنى هذا للرعاية الصحية اليومية
بعبارات بسيطة، تُظهر الدراسة أن نموذجًا حاسوبيًا مصممًا بعناية يمكنه تحديد مخاطر السكري المبكرة بدقة عالية باستخدام قائمة تحقق قصيرة مبنية على الأعراض وبعض البيانات الديموغرافية. من خلال حذف الأسئلة الأقل جدوى وتسليط الضوء على العلامات الأكثر دلالة—وخاصة التبول المتكرر والعطش الشديد والجنس—قد يدعم هذا الأسلوب أدوات فحص سريعة في العيادات، وبرامج الصحة المجتمعية، أو حتى أنظمة تعتمد على الهواتف الذكية. ومع أن العمل يحتاج لمزيد من الاختبار على عينات أكبر وأكثر تنوعًا، إلا أنه يشير إلى مستقبل قد تصبح فيه تحذيرات مبكرة للسكري أدق وأقل عبئًا على المرضى.
الاستشهاد: Sarker, P., Nahid, AA., Choi, K. et al. Feature reduction using swarm optimization and random forest classifiers for early diabetes risk prediction. Sci Rep 16, 14355 (2026). https://doi.org/10.1038/s41598-026-35984-7
الكلمات المفتاحية: التنبؤ بالسكري, تعلم الآلة, اختيار الميزات, تحسين السرب, التشخيص المبكر