Clear Sky Science · he

למידת מכונה מולטימודלית מרובת מקרים לחיזוי ביצוע במבחני מאמץ קרדיו‑ריאתי

· חזרה לאינדקס

מדוע זה חשוב לאנשים עם לב חלש

לאנשים החיים עם אי־ספיקת לב אחד השאלות הגדולות היא: "כמה זמן נשאר לי ומה הרופאים עדיין יכולים לעשות?" הבדיקה הרפואית הטובה ביותר כיום למתן תשובה היא מבחן מאמץ מאומץ על הליכון או אופניים שמודד כמה חמצן הגוף מסוגל לנצל במהלך פעילות אינטנסיבית. אך בדיקה זו קשה להשגה ואינה זמינה בהרבה בתי חולים. המחקר הזה מראה כיצד רופאים עשויים להשתמש במקום זאת בסריקות אקו לב שגרתיות ובמידע שכבר קיים בתיק הרפואי, בשילוב עם בינה מלאכותית מודרנית, כדי להעריך את המספר החיוני הזה ולהצביע על מטופלים שעשויים להזדקק לטיפולים מצילי חיים ומתקדמים.

האתגר בזיהוי סכנה מוקדם

אי־ספיקת לב פוגעת במיליונים בארצות הברית ולעיתים גוזלת יותר מעשור מחיי המטופל. בשלב המתקדם ביותר שלה, ההישרדות עלולה להיות גרועה יותר מזו של סרטן רבים, ובכל זאת רק חלק קטן מהמטופלים מקבל בזמן טיפולים כגון השתלת לב או משאבות מכניות. כלי מרכזי לקבלת החלטה מי צריך הפנייה לטיפולים אלה הוא מבחן מאמץ קרדיו‑ריאתי, שמודד את "פסגת צריכת ה‑O₂" (peak VO₂), המקסימום של חמצן שהגוף יכול לנצל במאמץ. ערך נמוך של peak VO₂ הוא סימן אזהרה חזק, אך הבדיקה דורשת ציוד מיוחד, צוות מאומן ומרחב, ולכן מרכזים רבים—במיוחד בתי חולים קטנים או כפריים—לא מסוגלים להציע אותה. לעומת זאת, סריקות אקו לב סטנדרטיות (אקוקרדיוגרפיה טרנס־טורצית, TTE) ורשומות רפואיות אלקטרוניות (EHR) זמינות ברוב המקומות אך, כשלעצמן, לא היו טובות במיוחד בחיזוי מי בסיכון הגבוה ביותר.

ללמד מחשבים לקרוא בין הבדיקות

החוקרים בנו מערכת בינה מלאכותית חדשה שלומדת משתי מקורות מידע מרכזיים: תמונות אקו תזזיתיות של הלב ונתונים מפורטים מרשומות ה‑EHR, כגון גיל, משקל, תרופות ומדידות לב סטנדרטיות. כל בדיקת אקו מכילה הרבה קליפים ותצפיות מיוחדות, ולכן במקום לנהג על כל תמונה בנפרד, המודל סוקר את כולן יחד, יותר כמו רופא. הוא משתמש באסטרטגיית "מרובת מקרים": תחילה ממיר כל תמונה או קליפ לתיאור קומפקטי, ואז משלב אותם באמצעות מנגנון תשומת לב שמאפשר למודל להתמקד בחלקים המידעיים ביותר. במקביל, רשת נוירונים מיוחדת שאומנה על סוגים רבים של נתונים טבלאיים רפואיים ממירה את נתוני ה‑EHR לסיכום משלה. שלב איחוד סופי מערבב את סיכומי האקו וה‑EHR לתמונה אחת של המטופל, ממנה המערכת חוזה את peak VO₂ ואת האפשרות שהאדם נופל מתחת לסף בטיחות קריטי.

Figure 1
Figure 1.

עד כמה המערכת מדויקת

הצוות אימן ובדק את הגישה שלהם על נתונים מארבעה בתי חולים גדולים ברשת New York–Presbyterian, כשהשתמשו ב‑1,000 מטופלים לפיתוח וב‑127 מטופלים מאתרים נפרדים לאימות חיצוני. בהשוואה למודל בינה מלאכותי קודם ופשוט יותר שדרש התייחסות נפרדת יותר לאקו ול‑EHR, המסגרת החדשה הייתה ברורה יותר במדויקוּתה. היא הסבירה כ‑60% מן השונות ב‑peak VO₂ בקבוצת הבדיקה העיקרית, לעומת כ‑53% קודם, והטעות הטיפוסית שלה הצטמצמה בכמחצית של יחידת השקול מטבולית (MET), שיפור קליני משמעותי. כאשר המטרה היתה פשוט לזהות מטופלים בסיכון גבוה — אלו עם יכולת מאמץ נמוכה במיוחד — המערכת הגיעה לשטח תחת העקומה (AUC) של 0.85 בקבוצת הפיתוח ו‑0.87 בבתי החולים החיצוניים, וכך עלתה על כל המודלים שהשתמשו רק באקו או רק ב‑EHR. במושגים מעשיים, בהתאמה קלינית סבירה בין מקרים מוחמצים להתרעות שווא, יותר מטופלים שבאמת היו בסיכון גבוה סומנו כראוי.

להציץ בתוך הקופסה השחורה

כדי לבדוק שהמודל מתמקד בתכונות סבירות, המחברים יצרו מפות חזותיות על פני תמונות האקו שהראו אילו אזורים השפיעו ביותר על התחזיות. המפות נטו להדגיש חללי לב, תנועתם וגלי זרימת דם — תכונות שעליהן קרדיולוגים מסתמכים כבר כיום — מה שמרמז שהמערכת לומדת דפוסים משמעותיים ולא רעש. בנתוני ה‑EHR, מדידות כמו גיל, מדד מסת גוף וכוח הכיווץ של החדר השמאלי בלטו כחשובות במיוחד, שוב בהתאמה לציפיות קליניות. החוקרים גם בדקו עד כמה המודל עבד בקבוצות משנה שונות. הביצוע היה דומה לגברים ולנשים ולמטופלים לבנים ולא לבנים בהערכת ערך ה‑peak VO₂ המדויק, אם כי הופיעו פערים אצל קשישים ובמיון סיכון גבוה בין גזעים, מה שמדגיש את הצורך בנתונים מגוונים יותר ובשכלול למען הוגנות.

Figure 2
Figure 2.

ממחקר לטיפול קליני

מכיוון שהמערכת משתמשת במידע שכבר נאסף בטיפול השגרתי — אקו לב סטנדרטי ונתוני EHR קיימים — היא יכולה, בעקרון, להשתלב ישירות בתוכנות של בית החולים. לאחר קריאת סריקה, ה‑AI יוכל בשקט להעריך את peak VO₂ ולהדגיש מטופלים שבהם יכולת המאמץ החזויה נמוכה בצורה מסוכנת, מה שיעודד רופאים להזמין בדיקות מאמץ פורמליות או להפנותם למומחים באי־ספיקת לב מתקדמת. התוצאות של המחקר, שכללו ביצועים חזקים גם בבתי חולים שלא שימשו לאימון, מרמזות שכלי כזה עשוי לסייע לתפוס יותר מטופלים בסכנה שעלולים להישמט אחרת. למרות שעדיין נדרשים ניסויים פרוספקטיביים ובדיקות רחבות יותר, עבודה זו מצביעה לעתיד שבו בדיקות עוצמתיות אך נדירות מלוות במערכות AI שעושות שימוש חכם יותר בנתונים שלרוב בתי החולים כבר יש.

ציטוט: Huang, Z., Pan, W., Alishetti, S. et al. Multimodal multi-instance learning for cardiopulmonary exercise testing performance prediction. npj Digit. Med. 9, 304 (2026). https://doi.org/10.1038/s41746-026-02493-w

מילות מפתח: אי־ספיקת לב, מבחן מאמץ קרדיו‑ריאתי, אקו לב, בינה מלאכותית, חיזוי סיכון