Clear Sky Science · he

למידה מונחית לחיזוי משתני שינוי נעלמים ב-pliable lasso

· חזרה לאינדקס

מדוע השפעות נסתרות חשובות לחיזוי

מהתגלות הונאות בכרטיסי אשראי ועד חיזוי סיכון למחלה — מחשבים כיום מבצעים תחזיות שמשפיעות על היבטים רבים של חיי היומיום. אך הנתונים בעולם האמיתי מלוכלכים: אותו קלט, כמו גיל או טמפרטורה, עשוי להיות חשוב בדרכים שונות בהתאם להקשר נסתר, כגון מגדר, תקופת זמן או תנאי מעבדה. מאמר זה בוחן כיצד להתמודד עם השפעות "בלתי נראות" אלה כאשר הן ידועות עבור נתוני העבר אך חסרות למקרים חדשים, ומדגים כיצד שילוב של כלי למידת מכונה שונים יכול להוליד תחזיות שהן גם מדויקות וגם קלות יותר לפרשן.

קישור בין קלטים, הקשר נסתר ותוצאות

המחקר מתמקד בשיטת רגרסיה חזקה הנקראת pliable lasso. בפשטות, שיטה זו חוזה תוצאה (כמו לחץ דם) ממספר רב של תכונות (כגון גיל או רמות חלבון) ובמקביל מאפשרת קבוצת "משתני שינוי" נפרדת לעקם או לעצב מחדש את היחסים האלה. לדוגמה, השפעת פעילות גופנית על לחץ הדם עשויה להשתנות לפי מגדר. ה-pliable lasso מיועדת לתפוס את האפקטים התלויים-הקשר אלה תוך שמירה אוטומטית על פשטות המודל כשאין צורך במורכבות מיותרת. היא עושה זאת על ידי העדפת דפוסים פשוטים אלא אם הנתונים תומכים בבירור באינטראקציות מורכבות יותר.

שלוש דרכים לטיפול בהקשר חסר

המחברים מתארים שלוש סיטואציות נפוצות עבור משתני השינוי האלה. במקרה ה"ידוע-ידוע" הפשוט ביותר, המשתנים נרשמים הן עבור נתוני האימון והן עבור נתונים עתידיים, ולכן ניתן להתאים את ה-pliable lasso פעם אחת ולהחילו ישירות. במקרה ה"ידוע-לא-ידוע" המאתגר יותר, המשתנים זמינים רק בנתוני האימון וצריך לאמודם עבור תצפיות חדשות. במקרה הקשה ביותר, ה"לא-ידוע-לא-ידוע", המשתנים מעולם לא נצפים ויש לאמודם בעקיפין, למשל על ידי קיבוץ של פרטים דומים. עבודה זו מתמקדת במקרה האמצעי, המעשי: המשתנים ידועים עבור נתוני העבר, אך יש לנבאם עבור נתונים חדשים לפני שה-pliable lasso יכול להשתמש בהם.

Figure 1
Figure 1.

בדיקת שיטות למידה רבות זו לצד זו

כדי לאמוד את המשתנים החסרים, המחברים משווים באופן שיטתי שמונה אלגוריתמים של למידה מונחית, כולל Random Forests, XGBoost, עצי החלטה, מכונות וקטורים תומכות, k-nearest neighbors, רשתות עצביות מלאכותיות, Lasso ו-Elastic Net. הם מעריכים שני שלבים בבת אחת: ראשית, עד כמה כל שיטה מסווגת נכון את משתני השינוי עצמם; שנית, עד כמה צינור ה-pliable lasso הכולל חזה את התוצאה הסופית לאחר שהמשתנים המוערכים הוזנו לתוכו. הבדיקות כוללות הן נתונים מדומים שעוצבו בקפידה והן שני מערכי נתונים אמיתיים: ביטוי חלבונים במוחות עכברים ותכונות חומר בסופרמוליכים. נעשה שימוש בוולידציה צולבת קפדנית וכיול היפרפרמטרים זהיר כדי למנוע תוצאות אופטימיות מדי ודליפה של מידע בין קבוצות האימון והבדיקה.

מה עובד הכי טוב ולמה

התוצאות חושפות מתיחות מעניינת. שיטות מבוססות עצים ואנסמבל כגון XGBoost, Random Forest ועצי החלטה בודדים מצטיינות בסיווג משתני השינוי, לעתים עם תוצאות כמעט מושלמות. יחד עם זאת, הן אינן תמיד מספקות את תחזיות התוצאה הטובות ביותר כאשר האומדנים שלהן מוזנים ל-pliable lasso. במקום זאת, מודלים ליניאריים פשוטים עם רגולריזציה כמו Lasso ו-Elastic Net נוטים לייצר את תחזיות התוצאה המדויקות והיציבות ביותר, גם כאשר דירוג הסיווג של המשתנים שלהם פחות מושלם במקצת. המחברים טוענים שזה קורה מכיוון ששיטות מבוססות עצים יכולות לייצר תוויות משתנה חדות אך שגויות לעתים, מה שמעוות את מבנה האינטראקציה העדין ב-pliable lasso, בעוד ששיטות ליניאריות מרוסנות מספקות אומדנים חלקים יותר שמתיישרים טוב יותר עם ההנחות של המודל.

Figure 2
Figure 2.

מתכון מעשי שניתן ליישום

לאנשי עשייה שמעוניינים בתחזיות חזקות וניתנות לפרשנות במצבים שבהם גורמי הקשר חשובים נצפים רק באופן חלקי, המחקר ממליץ על אסטרטגיה היברידית. ראשית, יש להשתמש במודלים חזקים מבוססי עץ כדי לאמוד את משתני השינוי החסרים, תוך ניצול יכולתם לזהות דפוסים מורכבים. לאחר מכן, יש לשלב את משתני השינוי המוערכים הללו עם התכונות המקוריות בתוך מודל pliable lasso, ובאופן אידיאלי להצמיד לשלב הרגרסיה הסופי מודלים כמו Lasso או Elastic Net. גישה דו-שלבית זו מנצלת את הטוב משני העולמות: גילוי גמיש של מבנה נסתר, ואחריו מודל ממושמע ושקוף לחיזוי תוצאות.

ציטוט: Hawrami, Z.S.M., Cengiz, M.A. & Dünder, E. Supervised learning for predicting unknown modifying variables in pliable lasso. Sci Rep 16, 10200 (2026). https://doi.org/10.1038/s41598-026-36854-y

מילות מפתח: pliable lasso, משתני משנה, למידה מונחית, מיקוד היברידי במודלים, אפקטים של אינטראקציה