Clear Sky Science · he

בחירת תכונות היברידית עם מודל למידת עומק חדש לחיזוי סיכון COVID-19

· חזרה לאינדקס

למה חיזוי סיכון COVID-19 עדיין חשוב

גם כשהעולם לומד לחיות עם COVID-19, הווירוס לא נעלם. מוטציות חדשות ממשיכות להופיע, בתי חולים יכולים עדיין להיות תחת עומס, ואנשים פגיעים נותרו בסיכון גבוה למחלה קשה או מוות. לכן רופאים זקוקים לשיטות מהירות ומהימנות להערכת הסבירות שחולה נדבק יפתח מחלה קשה. מאמר זה מציג מודל מחשב חדש שמשתמש בנתוני בית חולים ובכלים מתקדמים של בינה מלאכותית כדי לחזות את סיכון ה-COVID-19 בצורה מדויקת יותר, ובכך עשוי לסייע לרופאים להחליט מי צריך מעקב צמוד יותר, טיפול מוקדם או טיפול נמרץ.

מרשומות חולים גולמיות לאותות שימושיים

המחקר מתחיל עם מערך נתונים קליני מאוד גדול: יותר ממיליון חולים אנונימיים, כל אחד מתואר על ידי 21 תכונות פשוטות, ברובן כן/לא, כגון קבוצת גיל, מצבים רקעיים וגורמי סיכון נוספים. נתוני בתי חולים מהעולם האמיתי הם מבולגנים, לכן הצעד הראשון הוא "לנפות" אותם. הכותבים מיישמים טריק מתמטי הנקרא סקלינג לוגריתמי, שמדחס ערכים קיצוניים וממתח אשכולות של ערכים מאוד קטנים. הטרנספורמציה הזו מייצבת את הנתונים והופכת אותם לנוחים יותר לעיבוד על ידי האלגוריתמים, ומפחיתה את הסיכוי שמספרים יוצאי דופן או אינדיקטורים דלילים יטעו את המודל.

בחירת הסימנים החותכים ביותר

לא כל משתנה שנרשם מועיל באותה מידה לחיזוי, והרבה אותות חלשים עלולים דווקא לבלבל מערכת בינה מלאכותית. לכן החוקרים מבצעים בחירת תכונות — תהליך שסנן מידע פחות שימושי ושומר על הגורמים המשלימים ביותר. הגישה ההיברידית שלהם משלבת שתי רעיונות: מדד אחד בוחן עד כמה תכונה מבדילה בין מטופלים בסיכון גבוה לעומת נמוך, ואחר בודק עד כמה התכונות חופפות זו את זו. על ידי איזון שתי נקודות מבט אלה על סולם משותף, השיטה מעדיפה תכונות שהן גם עוצמתיות וגם לא מיותרות. הגזירה הזו מזרזת את הלמידה, מצמצמת התאמה-יתר וממקדת את המודל בתבניות הקליניות הרלוונטיות ביותר.

Figure 1
Figure 1.

שילוב זיהוי דפוסים עם חשיבה מטושטשת

הגרעין של המאמר הוא מנוע חיזוי חדש שנקרא רשת עצבית חזרתית קרונקרית עמוקה מטושטשת (Fuzzy-Deep Kronecker Recurrent Neural Network), או Fuzzy-DKRNN. הוא משלב מספר טכניקות משלימות. רכיב אחד, רשת קרונקר עמוקה, נועד לחשוף דפוסים קומפקטיים ומובנים החבויים בנתונים הקליניים. רכיב אחר, רשת עמוקה חזרתית, מתאים ללכידת תלותיות ומגמות, למשל כששילוב גורמים לאורך זמן משפיע על הסיכון. מעל אלה, הכותבים מוסיפים מערכת לוגיקה מטושטשת. במקום לקבל החלטות חד-משמעיות בלבד, כללים מטושטשים מבטאים הצהרות כגון "אם מספר אינדיקטורים של סיכון גבוהים במידה בינונית, המטופל ככל הנראה בסיכון גבוה." לכל כלל יש דרגת ודאות, המאפשרת למודל להתמודד עם חוסר הוודאות והאזורים האפורים השכיחים ברפואה.

כמה טוב המודל מתפקד?

הכותבים בוחנים בקפידה את מודל Fuzzy-DKRNN שלהם מול מספר אלטרנטיבות מתקדמות, כולל מערכות מבוססות צילומי חזה, למידת מכונה מסורתית וגישות עומק אחרות. באמצעות מדדים סטנדרטיים כגון דיוק, דיוק חיובי (precision), אחזור (recall) וציון F1, שיטותיהם מצטיינות בעקביות. בתצורה הטובה ביותר שלו המודל מסווג נכון כ-91% מהמקרים בסך הכל, עם יכולת גבוהה גם לזהות מטופלים שיהפכו למחלה קשה וגם למנוע אזעקות שווא אצל אלו שלא. השיפורים נשמרים גם כשמשנים את כמות נתוני האימון והגדרות אימות פנימיות, מה שמרמז שהגישה יציבה ולא מכוונת יתר לסצנריו ספציפי אחד.

Figure 2
Figure 2.

מה זה אומר עבור מטופלים ובתי חולים

בהוראות פשוטות, עבודה זו מראה ששילוב ניקוי נתונים קפדני, בחירה חכמה של גורמי סיכון מרכזיים והיבריד של למידת עומק עם לוגיקה מטשטשת יכולים להפיק חיזויי סיכון ל-COVID-19 מהימנים יותר ממידע קליני שגרתי. כלי כזה לא יחליף רופאים, אך יכול לשמש כעוזר התראה מוקדמת — לסמן מטופלים שמצדיקים מעקב צמוד יותר, לכוון חלוקה של משאבים מצומצמים כמו מיטות טיפול נמרץ, ולסייע בסופו של דבר בהפחתת מקרי מוות שניתן למנוע. אסטרטגיה דומה ניתנת גם להתאמה למחלות אחרות שבהן גילוי סיכון מוקדם מתוך נתונים קליניים מורכבים הוא קריטי.

ציטוט: P, G.S., Kathiravan, M., Shanthi, S. et al. Hybrid feature selection with novel deep learning model for COVID-19 risk prediction. Sci Rep 16, 4106 (2026). https://doi.org/10.1038/s41598-026-35013-7

מילות מפתח: חיזוי סיכון COVID-19, למידת עומק, לוגיקה מטושטשת, תמיכה קלינית בהחלטה, מודלים רפואיים מבוססי בינה מלאכותית