Clear Sky Science · he
מודל מבוסס אשכולות-ומשוואת-רגרסיה וניתוח ביצועים לחיזוי מוקדם של מחלות לב
מדוע חשוב לתפוס בעיות לב בשלבים מוקדמים
מחלות לב מתפתחות לעתים בהדרגה וללא סימנים גלויים לאורך שנים, וברגע שמופיעים תסמינים ברורים הנזק כבר עלול להיות נרחב. מחקר זה בוחן כיצד חיישנים לבישים יום‑יומיים וניתוח נתונים חכם יכולים לפעול יחד כדי לזהות סימני אזהרה מוקדם יותר, ולהעניק לרופאים ולמטופלים זמן רב יותר לפעול. על ידי שילוב שתי דרכי התבוננות בנתוני בריאות, החוקרים שואפים לשפר את הדיוק של תחזיות מבלי להקשות על השימוש בטכנולוגיה בקליניקות אמתיות.

מחיישנים על הגוף לאזהרות חכמות
העבודה מתרחשת בעולם רשתות אזור גוף אלחוטיות, שבהן חיישנים קטנים המונחים על העור עוקבים אחר אותות כגון קצב לב, לחץ דם ופעילות חשמלית של הלב. חיישנים אלה שולחים מדידות למכשיר נייד, שמעביר אותן למרכז רפואי לניתוח. הרעיון המרכזי הוא שזרמי מספרים אלה יכולים לחשוף דפוסים שמעידים על בעיות לב המתפתחות הרבה לפני משבר. המחברים מתמקדים במאגר נתונים ידוע למחלות לב, ובוחרים 12 תכונות חשובות הכוללות סוג כאב בחזה, לחץ דם, כולסטרול, סוכר בדם, כאב בחזה בשעת מאמץ ושינויים הנצפים באקג.
מציאת קבוצות נסתרות בנתוני מטופלים
במקום להזין את כל רשומות המטופלים ישירות לנוסחת תחזית אחת, הצוות מקבץ תחילה מטופלים דומים יחד. הם משתמשים בשיטה שנקראת K‑means clustering, שממיינת אנשים לאשכולות על פי הדמיון במדידות שלהם, כשהגיל תופס תפקיד מרכזי. לדוגמה, מטופלים יכולים להיפרד באופן טבעי לקבוצות עם לחץ דם מאוד גבוה, כולסטרול גבוה, או דפוסים מסוימים בבדיקות לב. שלב הקיבוץ הזה עוזר להבליט אילו שילובים של מדידות הם בעלי אופי מדאיג במיוחד. הוא גם מגלה שטווחים מסוימים — כגון לחץ דם מעל 150, כולסטרול מעל 300, או שינויים מסוימים בעקבות הלב — נוטים להיות קשורים בסיכון גבוה יותר.
להדריך מכונות לשפוט סיכון
לאחר הקבצים, החוקרים מיישמים מספר שיטות למידת מכונה שלומדות ממקרים קודמים כדי לחזות האם מטופל חדש סביר שיקיים מחלת לב משמעותית. הם משווים בין גישות שונות, כולל עצי החלטה, k‑השכנים הקרובים, מכונות וקטור תומכות, רגרסיה לוגיסטית, נאיב בייס ויערות אקראיים. בעיצוב ההיברידי שלהם, כל מטופל חדש מקבל תחילה שיוך לאשכול הקרוב ביותר; ואז מודל יער אקראי שאומן במיוחד על סוג מטופלים זה מבצע את תחזית הסיכון הסופית. הנתונים מנוקים, נרמלים ומחולקים בקפידה לסטי אימון ובדיקה, ואי‑שוויון בכיתות (יותר מטופלים בריאים מאשר חולים) מטופל כדי שהמודלים לא יהפכו מקטבים כלפי הקבוצה הרובית.

כמה טוב המודל ההיברידי עובד
להערכת ההצלחה, המחקר בוחן לא רק את הדיוק הכולל אלא גם כמה פעמים המודל מסמן נכון מטופלים חולים (זיכרון/recall), מרגיע נכון בריאים (ספציפיות), ומאוזן בין שני היעדים הללו (ציון F1 ו‑ROC–AUC). מחקרים קודמים שהשתמשו בנתונים דומים לרוב הגיעו לכ־85 אחוז דיוק והתקשו לשפר מדדים עדינים אלה. כאן, השילוב של קיבוץ ויער אקראי מגיע לכ־91 אחוז דיוק, עם זיכרון חזק וספציפיות גבוהה מאוד. מרווחי הביטחון של מודל זה אינם חופפים לאלה של השיטות הפשוטות יותר, מה שמרמז שהשיפור אינו סביר שנבע במקרה. במקביל, זמן החישוב נשאר בטווח מעשי — בסדר גודל של מילישניות עד שניות — המתאים למערכות ניטור בזמן אמת או קרוב לזמן אמת.
מה זה אומר למטופלים ולרופאים
במונחים יומיומיים, המחקר מראה שלתת למחשבים תחילה למיין מטופלים לקבוצות משמעותיות ואז ליישם כללים מותאמים לניבוי יכול לחדד את הגילוי המוקדם של מחלות לב. השיטה מבטיחה במיוחד עבור הגדרות ניטור רציפות, שבהן חיישנים לבישים אוספים נתונים ברקע בצורה שקטה. אמנם התוצאות מבוססות על מאגר נתונים ממדי ומבני יחסית ולא על רשומות קליניות מלאות, והמחברים מזהירים מפני הטיות אפשריות, המסר ברור: שימוש חכם במדידות קיימות יכול לספק לרופאים מערכת התראה מוקדמת אמינה יותר. בעבודה נוספת והרחבת מאגרים עשירים וגדולים יותר, ניתוח היברידי מסוג זה יכול לסייע להפוך קריאות גולמיות של חיישנים לאזהרות מותאמות בזמן שימנעו התקפי לב ואירועים חמורים אחרים לפני שהם מתרחשים.
ציטוט: Tolani, M., AlZahrani, Y., Suman, G. et al. Clustering-cum-regression based model and performance analysis for early prediction of heart disease. Sci Rep 16, 9494 (2026). https://doi.org/10.1038/s41598-026-40626-z
מילות מפתח: חיזוי מחלות לב, חיישנים לבישים לבריאות, למידת מכונה, אשכולות בנתונים רפואיים, מודל יער אקראי