Clear Sky Science · he

עיצוב אלגוריתם מוסבר המבוסס על XGBoost ואלגוריתם גנטי לחיזוי הצורך באשפוז של חולי COVID-19

· חזרה לאינדקס

למה זה חשוב לטיפול היומיומי

במהלך מגפת COVID-19 רופאים נאלצו לעתים להחליט במהירות מי זקוק למיטת אשפוז ומי יכול להחלים בבטחה בבית. מאמר זה מתאר כלי ממוחשב שנועד לסייע בהחלטה זו. הוא מנסה לשלב שתי תכונות חשובות: דיוק חזק בזיהוי מטופלים בסיכון והסברים ברורים ופשוטים שרופאים יכולים לסמוך עליהם ולהשתמש בהם בפועל.

הפיכת רשומות מטופלים לאיתותים מוקדמים

החוקרים ניתחו רשומות רפואיות של 1,278 מבוגרים עם COVID-19 שנבדקו בבית חולים אחד באיראן בין אפריל 2020 למרץ 2021. עבור כל מטופל אספו 27 פריטי מידע, כולל גיל, ריוויון חמצן, בדיקות דם כגון חלבון C-תגובותי (CRP) ו-D-dimer, תסמינים כמו חום או קוצר נשימה ומחלות רקע כגון סוכרת או יתר לחץ דם. נשמרו רק רשומות עם עדויות מעבדתיות או סריקתיות מוצקות ל־COVID-19 ונתונים יחסית שלמים. הצוות ניקא את מאגר הנתונים בקפידה, השלימו חלק מהערכים החסרים בשיטות סטטיסטיות, הסירו שגיאות ברורות ואז חלקו את הנתונים לקבוצות נפרדות לבניית המודלים ובדיקתם.

Figure 1
Figure 1.

בניית מנוע חיזוי חזק

בלב המערכת עומדת שיטת למידת מכונה בשם XGBoost, שמצטיינת בזיהוי דפוסים בנתונים מורכבים. הכלי לומד ממטופלים קודמים אילו שילובים של מדידות נוטים לציין צורך בטיפול אשפוזי. כאשר נבדק 100 פעמים על נתונים חדשים, הוא הפריד בצורה נכונה בין מטופלים בסיכון גבוה לנמוך עם שטח תחת העקומה (AUC) של 0.85, כלומר היה חזק בדירוג מי צפוי להזדקק לאשפוז. הוא זיהה בערך שלושה מתוך ארבעה מטופלים שהיו באמת זקוקים לאשפוז והרגיע נכון כ־תשעה מתוך עשרה אנשים שלא היו זקוקים לכך. בהשוואה לגישות מסורתיות יותר—כגון רגרסיה לוגיסטית, יערות אקראיים, רשת עצבית פשוטה ושיטה נוספת מבוססת-עץ בשם LightGBM—XGBoost נתן את השילוב הטוב ביותר של דיוק ואמינות.

ממכונה סגורה לכללים ברורים עבור רופאים

מודלים סטטיסטיים טהורים עלולים להיתפס כקופסה שחורה: הם נותנים ציון סיכון אך לא סיבה ברורה לבני אדם. כדי לפתוח את הקופסה, הצוות הוסיף שכבה שנייה שהופכת את התנהגות המודל לכללים קצרים וקלים לקריאה בצורת "אם תנאים אלה קיימים, אז האשפוז סביר". הם אימנו תחילה קבוצה של עצי החלטה קטנים שמשתמשים רק בכמה תנאים בכל פעם, ואז התייחסו לכל מסלול דרך העצים הללו כאל כלל מועמד. אלגוריתם גנטי — שיטה לאופטימיזציה בהשראת אבולוציה — שימש לקצץ וללטש את הכללים, כך שישמרו רק אלה שהיו גם מדויקים וגם חלים על מספיק מטופלים כדי להיות שימושיים. לבסוף, עשר רופאים מתחומי התמחות רלוונטיים דירגו את הכללים, והשאירו רק את אלה שהיו סבירים מבחינה רפואית וברורים. תהליך זה הניב 40 כללים סופיים, 20 שהצביעו לאשפוז ו־20 שהצביעו על טיפול אמבולטורי בטוח.

Figure 2
Figure 2.

מה המודל למד על סיכון

כשבדקו אילו מדידות השפיעו ביותר, קבוצה קטנה בלטה. ריוויון חמצן נמוך, CRP גבוה, גיל מבוגר, D-dimer מוגבר, פריטין גבוה ואחוז לימפוציטים נמוך השפיעו ביותר על התחזיות — תואם ניסיון הקו הקדמי שמדדי חמצן וסימנים של דלקת או קרישיות הם מכריעים. מצבים כמו סוכרת, מעורבות ריאתית משמעותית בסריקות CT וקוצר נשימה גם הם שיחקו תפקיד אך היו פחות מרכזיים במעט. תסמינים שכיחים כמו שיעול או כאבי שרירים תרמו מעט להחלטה מי צריך מיטת אשפוז. הצוות גם בדק ביצועים בקרב גברים ונשים, מטופלים צעירים ומבוגרים, ובין אלה עם מחלות כרוניות משמעותיות וללא — ההבדלים היו קטנים ולא בעלי משמעות סטטיסטית, מה שמרמז שהכלי פעל באופן הוגן יחסית בקבוצות אלה, לפחות במאגר הנתונים הזה.

איך זה יכול לסייע בהתפרצויות עתידיות

בפרקטיקה, המערכת תפעל בשני שלבים. ראשית, מודל ה‑XGBoost מחשב סיכון לאשפוז מתוך המידע הבסיסי של המטופל, סימנים חיוניים ובדיקות דם שגרתיות. שנית, הכלי מחפש אחד מהכללים המאושרים על ידי מומחים שמתאים למטופל זה — למשל שילוב מסוים של חמצן נמוך, סמני דלקת גבוהים וגיל. אם נמצא כלל תואם שהסכים עם תחזית המודל, הכלי מציג את הכלל הזה למטפל כסיבת ההחלטה המוצעת. החוקרים טוענים שעיצוב דו‑חלקי זה — חיזוי מדויק פלוס כללים פשוטים ומאומתים — יכול להפוך בינה מלאכותית לקבלה טובה יותר במרפאות אמיתיות. מכיוון שתהליך יצירת הכללים מודולרי, מערכות דומות יכולות להיות מאומנות מחדש במהירות למחלות זיהומיות חדשות באמצעות נתונים מקומיים, ועוזרות לבתי חולים למיין מטופלים ולנהל משאבים נדירים בעת משבר בריאותי עתידי.

ציטוט: Abkar, A., Mehrabi, M., Golabpour, A. et al. Designing an explainable algorithm based on XGBoost and genetic algorithm for predicting hospitalization needs of COVID-19 patients. Sci Rep 16, 10210 (2026). https://doi.org/10.1038/s41598-026-40120-6

מילות מפתח: מיון COVID-19, תחזית אשפוז, בינה מלאכותית מוסברת, תמיכה בהחלטות קליניות, למידת מכונה ברפואה