Clear Sky Science · he
שיטת בחירת תכונות היברידית מונחת AI מובן לאבחון מחלת עורקי הלב
מדוע זה חשוב ללב שלך
מחלת עורקי הלב היא הגורם לעשרות רבות של התקפי לב, ובכל זאת לעתים קרובות היא נותרת סמויה עד שנגרם נזק חמור. לרופאים קיימים בדיקות רבות, אך רבות מהן יקרות, פולשניות או שקשות להשגה, במיוחד במדינות בעלות הכנסה נמוכה ובינונית. מאמר זה חוקר כיצד סוג חדש של אינטליגנציה מלאכותית מובן יכול לסנן מידע רפואי שגרתי כדי לזהות מי בסיכון, תוך שימוש בכמות מדידות קטנה יותר ובאותו הזמן מספק תובנה לרופאים על אילו סימנים באמת חשובים.

בעיה של עודף מידע
הרפואה המודרנית יכולה למדוד עשרות תכונות עבור כל חולה לב: גיל, לחץ דם, ערכי מעבדה, סימפטומים וממצאים מתצפיות ותמונות. אבל לא כל הרמזים הללו מועילים באותה מידה. שימוש במספר גדול מדי של מדידות חלשות או חופפות יכול לבלבל מודלים ממוחשבים, להאט אותם ולהפוך את התחזיות לפחות אמינות. מחקרים קודמים ניסו שיטות רבות לקיצוץ הרשימה הזו, אך אף שיטה אחת לא עבדה באופן עקבי הטוב ביותר, ורובן פעלו כקופסאות שחורות, מבלי להסביר מדוע תכונה מסוימת נבחרה או נפסלה.
דרך חכמה יותר לבחור את הרמזים הנכונים
המחברים מציעים שיטה דו-שלבית שנקראת SHOW (SHAP Optimized Wrapper) כדי להתמודד עם הבעיה. קודם כל הם משתמשים בטכניקת AI מובן הידועה כ‑SHAP כדי להעריך עד כמה כל תכונה רפואית תורמת לחיזוי מחלת עורקי הלב. הם עושים זאת בנפרד עבור שלושה מודלים חזקים של למידת מכונה המתייחסים לבעיה בדרכים שונות. לאחר מכן הם ממזגים את שלוש הדעות האלה לדירוג יציב אחד של תכונות, כדי שלא להישען על סגולותיו של מודל יחיד. כך מתקבל רשימה מסודרת מהרמזים הקליניים המיידעים ביותר ועד הפחות מועילים.
בניית מודלים חזויים מדויקים וממוקדים
בשלב השני, SHOW יורדת לאורך רשימת הדירוג הזו ובונה בהדרגה סט תכונות לכל מסווג. מתחילים בתכונה העליונה, מאמנים מודל ואז מוסיפים את התכונה הבאה בתור. אם הוספת תכונה חדשה משפרת את הדיוק — היא נשארת; אם לא — היא מוותרת. התהליך נמשך עד שלא נרשמים שיפורים נוספים. בדרך, הנתונים מעובדים בקפידה: רשומות עם ערכים חסרים מוסרות, מקרים נדירים של מחלה מאוזנים בעזרת טריק oversampling סטנדרטי, וערכים מספריים מוקנעים כך שלא תכונה בודדת תשתלט רק בשל טווח הערכים הגולמי שלה.

בדיקת השיטה במבחן
כדי לבדוק האם SHOW אכן מסייעת, הצוות בחן אותה על שלוש מערכות נתונים ידועות של מחלת עורקי הלב השונות בגודל, במורכבות ובשיעור החולים החולים בפועל. הם ניסו שבעה מודלים פופולריים של למידת מכונה, מהרגרסיה הלוגיסטית הפשוטה ועד טכניקות מתקדמות יותר כמו Random Forests ו‑XGBoost. עבור כל מערך נתונים הם השוו ביצועים בעזרת כל התכונות הזמינות מול רק אלה שנבחרו על־ידי SHOW, וחזרו על הבדיקות פעמים רבות במסגרת סכמת cross‑validation כדי למנוע תוצאות מקריות. הם גם עקבו לא רק אחרי הדיוק הכולל אלא גם כיצד המודלים נמנעים מהחמצת חולים חולים ועד כמה הם מצליחים להפריד בין בריאים לחולים.
מה שנמצא בנתוני חולים אמיתיים
בכל שלוש מערכות הנתונים, SHOW איפשרה בעקביות למודל XGBoost להשוות או להתעלות על התוצאות הטובות ביותר שדווחו בספרות תוך שימוש בהרבה פחות קלטים. לדוגמה, במערך נתונים עם 55 תכונות קליניות, SHOW קיצרה את הרשימה ל‑14 והשיגה דיוק של כ‑94% ורגישות דומה גבוהה, כלומר רוב החולים החולים זוהו נכון. בשני מערכים אחרים עם 13 תכונות כל אחד, השיטה בחרה רק 5 תכונות תוך שמירה על דיוק סביב 86–88%. במונחים מעשיים, הדבר מרמז כי מספר מרוכז של מדידות — כגון סוגים מסוימים של כאב בחזה, תוצאות מעבדה מפתח וממצאי דימות מסוימים — יכולים לשאת את מרבית המשקל האבחנתי כשנבחרים בחוכמה.
מבט קדימה לבדיקות לב פשוטות וברורות יותר
המחקר מראה כי AI מובן יכול לעשות יותר מאשר לספק תחזיות; הוא יכול לסייע להבהיר אילו סימנים קליניים יומיומיים באמת חשובים לאבחון מחלת עורקי הלב. על‑ידי זיהוי סט קטן ובעל ערך גבוה של מדידות, SHOW יכולה לתמוך בכלים לסריקה זולים ומהירים יותר שעדיין אמינים מאוד ושקופים יותר לרופאים. למרות שהשיטה עתירת חישוב ותידרש פישוט עבור מערכי נתונים גדולים מאוד, היא מציעה מסלול מבטיח לעבר עוזרי AI חכמים וברורים יותר שיסייעו לרופאים לתפוס מחלות לב מוקדם יותר מבלי לטבוע בעודף מידע.
ציטוט: Elemam, T., Refaat, H. & Makhlouf, M. An explainable AI-driven hybrid feature selection approach for coronary artery disease diagnosis. Sci Rep 16, 10411 (2026). https://doi.org/10.1038/s41598-026-41712-y
מילות מפתח: מחלת עורקי הלב, AI מובן (explainable AI), בחירת תכונות, אבחון רפואי, למידת מכונה