Clear Sky Science · he
מודל היברידי להסבר מבוסס למידת מכונה לחיזוי עיכוב גדילה וזיהוי גורמי סיכון מרכזיים בקרב ילדים מתחת לגיל חמש באתיופיה
מדוע חיזוי גדילת ילדים חשוב
במדינות בעלות הכנסה נמוכה רבות, ילדים רבים אינם גדלים לגובה או לחוזק המצופה עקב חוסר ממושך בתזונה נאותה, מחלות ותנאי מחיה ירודים. מצב זה, המכונה עיכוב גדילה (stunting), פוגע בלמידה, בבריאות ובאפשרויות ההשתכרות העתידיות. באתיופיה יותר מאחד מכל שלושה ילדים מתחת לגיל חמש מושפעים. המחקר המסוכם כאן בוחן כיצד סוג חדש של תוכנה יכול לסייע לאנשי בריאות לזהות אילו ילדים נמצאים בסיכון הגבוה ביותר, באמצעות מידע שסקרים כבר אוספים, ובמקביל להסביר כיצד ובאיזה אופן המערכת מגיעה למסקנותיה.
להסתכל על עיכוב הגדילה כיותר ממספר
החוקרים התחילו עם נתונים מסקר הדמוגרפיה והבריאות של אתיופיה מ-2019, הכולל פרטים על אלפי ילדים מתחת לגיל חמש ובני משפחותיהם. עבור כל ילד הסקר מתעד גובה וגיל כך שרמת העיכוב יכולה להיות מקובצת לשלוש קטגוריות: גדילה נורמלית, עיכוב בינוני או עיכוב חמור. מכיוון שמספר הילדים בקטגוריית העיכוב החמור קטן בהרבה מהקבוצה הנורמלית, הצוות איזן בקפידה את הנתונים כדי שהמחשב ילמד לזהות את כל שלוש הקטגוריות בהגינות במקום להטות את עצמו אל הקטגוריה הנפוצה ביותר. לאחר מכן ניקו, המירו ובדקו את המידע כדי לוודא שהוא מתאים לניתוח.

מיזוג שני כלים חכמים לאחד
במקום להסתמך על סוג יחיד של מודל למידת מכונה, המחברים יצרו מערכת היברידית שמחברת שתי גישות חזקות. חלק אחד, הנקרא Extra Trees, בונה עצי החלטה רבים המצטיינים בגילוי תבניות בנתונים מעורבים, כגון אזור, גודל משפחה והיסטוריית לידות. החלק השני, שנקרא multilayer perceptron, הוא רשת עומק פשוטה שיכולה ללכוד קשרים עדינים יותר לאחר שהנתונים עוברו המרה. בעיצוב שלהם, המודל מבוסס-העצים מעבד תחילה את הנתונים ומעביר אותות עשירים לרשת הנוירונים, אשר מפיקה את התחזית הסופית האם הילד נורמלי, בעל עיכוב בינוני או עיכוב חמור.
דיוק עם זהירות
המודל ההיברידי אומן על יותר מאלפיים-עשר רשומות ילדים ונבדק על סט נפרד. הוא הגיע לכ-94% דיוק, דיוק חיובי (precision), אחזקה (recall) וציוני F1, והציג ביצועים חזקים ב-cross validation, מה שמרמז שהתחזיות יציבות ולא קוריוז מדגימה בודדת. מטריצת בלבול מפורטת חשפה שהמודל טוב במיוחד להבחין בין ילדים נורמליים באופן ברור לבין ילדים הסובלים מעיכוב חמור באופן ברור, בעוד שרוב השגיאות מתרחשות בגבולות שבין עיכוב בינוני לחמור. המחברים מדגישים כי הסקר מספק רק תמונת מצב ברגע נתון, ולכן המודל מוצא אסוציאציות חזקות ולא מוכיח כי גורם מסוים הוא סיבת ישירה לעיכוב גדילה.

לפתוח את התיבה השחורה
דיוק גבוה לבדו אינו מספיק לקבלת החלטות בריאות ציבורית, משום שמקבלי ההחלטות והרופאים זקוקים להבנה מדוע מערכת מסמנת ילד כנתון לסיכון. כדי להתמודד עם זאת, המחקר משתמש בכלי בינה מלאכותית מוסברת, ובפרט בשיטה הנקראת LIME, הפורקת כל תחזית לתרומות של גורמים בודדים. באמצעות בדיקת חשיבות התכונות והסברים מקומיים, מצאו החוקרים כי גיל הילד, אזור המגורים, מרווח הלידות והמספר של ילדים מתחת לגיל חמש במשק הבית היו החזויים המשפיעים ביותר. אותות מסייעים נוספים כללו השכלה של האם, עושר הבית וגישה למים נקיים, החוזרים על ממצאים קודמים בתחום התזונה.
מהתחזית לפעולה מעשית
לקורא הרחב, המסר המרכזי הוא ששימוש זהיר בבינה מלאכותית יכול לסייע לאנשי בריאות לעבור מלאדם שספירה של כמה ילדים סובלים מעיכוב גדילה לזהות אילו ילדים וקהילות זקוקים לעזרה בדחיפות. המודל ההיברידי לא נותן תשובה מוחלטת לגבי הסיבות לעיכוב הגדילה, אך הוא מציע דרך אמינה ושקופה לזהות ילדים בעלי סיכון סטטיסטי גבוה יותר בהתבסס על שאלות סקר הנגישות בקלות. בשילוב עם שיקול קליני, הוא יכול להנחות תוכניות ממוקדות בתחומי תזונה, מים נקיים ותכנון משפחה, ולעזור לאתיופיה ולמדינות דומות למקם משאבים מוגבלים היכן שהם יכולים להגן יותר על גדילת הילדים ופוטנציאלם לעתיד.
ציטוט: Wudu, T.K., Endalew, A.A. & Dires, A.A. Explainable hybrid machine learning model for predicting stunting and identifying key risk factors among Ethiopian children under five. Sci Rep 16, 16204 (2026). https://doi.org/10.1038/s41598-026-46417-w
מילות מפתח: עיכוב גדילה בילדות, אתיופיה, למידת מכונה, בינה מלאכותית מוסברת, תזונת ילדים