Clear Sky Science · ar

تصميم خوارزمية قابلة للتفسير تعتمد على XGBoost والخوارزمية الجينية للتنبؤ باحتياجات إدخال مرضى COVID-19 إلى المستشفى

· العودة إلى الفهرس

لماذا هذا مهم في الرعاية اليومية

أثناء جائحة COVID-19، اضطر الأطباء في كثير من الأحيان إلى اتخاذ قرار سريع بشأن من يحتاج سريرًا بالمستشفى ومن يمكن أن يتعافى بأمان في المنزل. تصف هذه الورقة أداة حاسوبية مصممة للمساعدة في ذلك القرار. تسعى الأداة لدمج صفتين مهمتين: دقة عالية في رصد المرضى المعرضين للخطر، وتفسيرات واضحة وبسيطة يمكن للأطباء الوثوق بها واستخدامها فعليًا.

تحويل السجلات المرضية إلى إنذارات مبكرة

حلل الباحثون السجلات الطبية لـ 1278 بالغًا مصابًا بـ COVID-19 تم تشخيصهم في مستشفى واحد في إيران بين أبريل 2020 ومارس 2021. جمعوا لكل شخص 27 عنصرًا من المعلومات، بما في ذلك العمر، مستوى الأكسجة، تحاليل دم مثل بروتين سي التفاعلي وD-dimer، أعراض مثل الحمى أو ضيق التنفس، والأمراض المزمنة الموجودة مثل السكري أو ارتفاع ضغط الدم. احتُفظ فقط بالسجلات التي كانت مدعومة بأدلة مختبرية أو تصويرية قوية لوجود COVID-19 والتي تحتوي على بيانات كاملة إلى حد معقول. قام الفريق بتنقية مجموعة البيانات بعناية، وملأ بعض القيم المفقودة بطرق إحصائية، وأزال الأخطاء الواضحة، ثم قسم البيانات إلى مجموعات منفصلة لبناء نماذجهم واختبارها.

Figure 1
الشكل 1.

بناء محرك تنبؤ قوي

جوهر النظام هو طريقة تعلم آلي تسمى XGBoost، وهي جيدة جدًا في اكتشاف الأنماط داخل البيانات المعقدة. تتعلم الأداة من حالات المرضى السابقة أي تراكيب القياسات تميل إلى الإشارة إلى حاجة للاستشفاء. عند اختبارها 100 مرة على بيانات جديدة، نجحت في فصل المرضى ذوي المخاطر الأعلى عن الأقل بدقة قياسية بمساحة تحت المنحنى بلغت 0.85، ما يعني أنها قوية في ترتيب من هم الأكثر احتمالًا للحاجة إلى قبول بالمستشفى. حدَّدت تقريبًا ثلاثة من كل أربعة مرضى كانوا فعلاً بحاجة للاستشفاء وطمأنت بشكل صحيح نحو تسعة من كل عشرة أشخاص لم يكونوا بحاجة لذلك. بالمقارنة مع أساليب أكثر تقليدية — مثل الانحدار اللوجستي، والغابات العشوائية، وشبكة عصبية بسيطة، وطريقة قائمة على الأشجار أخرى تسمى LightGBM — قدم XGBoost أفضل مزيج من الدقة والموثوقية.

من الصندوق الأسود إلى قواعد واضحة للأطباء

النماذج الإحصائية البحتة يمكن أن تبدو كصندوق أسود: تعطي درجة مخاطرة لكنها لا تعطي سببًا مفهومًا للبشر. لفتح ذلك الصندوق، أضاف الفريق طبقة ثانية تحول سلوك النموذج إلى قواعد قصيرة وسهلة القراءة على شكل «IF هذه الشروط موجودة، THEN الاستشفاء محتمل». دربوا أولًا مجموعة من أشجار القرار الصغيرة التي تستخدم عددًا قليلاً فقط من الشروط في كل مرة، ثم اعتبروا كل مسار عبر هذه الأشجار كقاعدة مرشحة. استُخدمت خوارزمية جينية — وهي طريقة تحسين مستوحاة من التطور — لاقتطاع هذه القواعد وصقلها، مع الاحتفاظ فقط بتلك التي كانت دقيقة وتنطبق على عدد كافٍ من المرضى لتكون مفيدة. أخيرًا قيم عشرة أطباء من التخصصات ذات الصلة هذه القواعد، محتفظين فقط بالقاعدة ذات المضمون الطبي المعقول والواضح. أنتج هذا المسار 40 قاعدة نهائية، 20 تشير إلى الاستشفاء و20 تشير إلى إمكانية الرعاية الخارجية بأمان.

Figure 2
الشكل 2.

ما الذي تعلَّمه النموذج عن عوامل الخطر

عند استكشاف الباحثين القياسات الأكثر تأثيرًا، برزت مجموعة صغيرة منها. كان لانخفاض تشبع الأكسجين، وارتفاع بروتين سي التفاعلي، والتقدم في العمر، وزيادة D-dimer، وارتفاع الفيريتين، وانخفاض نسبة اللمفاويات التأثير الأكبر على التنبؤات — وهو ما يتوافق مع خبرة الخطوط الأمامية بأن مستويات الأكسجين وعلامات الالتهاب أو التخثر حاسمة. لعبت حالات مثل السكري، وتورط الرئة الملحوظ في الأشعة المقطعية، وضيق التنفس دورًا أيضًا لكنها كانت أقل مركزية بعض الشيء. الأعراض الشائعة مثل السعال أو آلام العضلات ساهمت قليلًا في قرار من يحتاج سريرًا بالمستشفى. كما فحص الفريق الأداء عبر الرجال والنساء، والمرضى الأصغر والأكبر سنًا، ومن لديهم أو ليس لديهم أمراض مزمنة كبيرة. كانت الفروق ضئيلة وغير ذات دلالة إحصائية، ما يوحي بأن الأداة تصرفت بعدل عبر هذه المجموعات، على الأقل داخل مجموعة البيانات هذه.

كيف قد يساعد هذا في تفشيات مستقبلية

في التطبيق العملي، يعمل النظام على مرحلتين. أولًا، يحسب نموذج XGBoost خطر الاستشفاء استنادًا إلى المعلومات الأساسية للمريض، والوظائف الحيوية، وفحوصات الدم الروتينية. ثانيًا، تبحث الأداة عن واحدة من القواعد المعتمدة من الخبراء التي تطابق هذا المريض — مثل تركيبة معينة من انخفاض الأكسجة، وارتفاع مؤشرات الالتهاب، والعمر. إذا وُجدت قاعدة مطابقة تتفق مع توقع النموذج، تعرض الأداة تلك القاعدة على الطبيب كسبب مقترح وراء القرار الموصى به. يجادل المؤلفون بأن هذا التصميم ذي الجزأين — تنبؤ دقيق بالإضافة إلى قواعد بسيطة ومراجعة — قد يجعل الذكاء الاصطناعي أكثر قبولًا في العيادات الحقيقية. وبما أن عملية توليد القواعد معيارية، فبإمكان أنظمة مماثلة إعادة تدريبها بسرعة لأمراض معدية جديدة باستخدام بيانات محلية، مما يساعد المستشفيات على تقييم المرضى وإدارة الموارد الشحيحة أثناء أزمات صحية مستقبلية.

الاستشهاد: Abkar, A., Mehrabi, M., Golabpour, A. et al. Designing an explainable algorithm based on XGBoost and genetic algorithm for predicting hospitalization needs of COVID-19 patients. Sci Rep 16, 10210 (2026). https://doi.org/10.1038/s41598-026-40120-6

الكلمات المفتاحية: تقييم حالات COVID-19, التنبؤ بالاستشفاء, الذكاء الاصطناعي القابل للتفسير, دعم القرار السريري, تعلم الآلة في الرعاية الصحية