Clear Sky Science · he

אימון ניגודי שפה-תמונה להטמעת דימות תהודה מגנטית קרדילי עם יכולות זירו-שוט

2026-05-21 · חזרה לאינדקס

למה חשוב ללמד מחשבים לקרוא סריקות לב

סריקות MRI של הלב יכולות לחשוף סימנים עדינים למחלות זמן רב לפני שהסימפטומים נעשים ברורים, אך כל סריקה כוללת מאות תמונות שלוקחות למומחים זמן רב לקריאה. במחקר זה נבדק האם מערכת בינה מלאכותית יכולה ללמוד "להבין" את הסריקות המורכבות הללו ואת הדוחות הכתובים שלהן כדי לסייע לרופאים למיין מקרים, לזהות דפוסי מחלה ואפילו לנסח דוחות — כל זאת מבלי שקיבלה הסבר מפורש לגבי מה כל תמונה מראה.

Figure 1. בינה מלאכותית מקשרת סרטוני MRI של הלב במלואם עם דוחות כדי לעזור לזהות אוטומטית מחלות לב שונות.

דרך חדשה לשדך תמונות ומילים

החוקרים בנו מערכת שנקראת CMR-CLIP שמקשרת תמונות MRI של הלב עם חלק הסיכום הקצר בדוח הרופא. במקום להתייחס לכל תמונה לחוד, הם התייחסו לכל בדיקה כאל קטע וידאו קצר המורכב ממבטי לב סטנדרטיים וטכניקות דימות שונות. במקביל, המערכת קוראת את ממצא הכתב שמתאר את הממצאים והמחלות המרכזיות. על ידי אימון על יותר מ-14,000 בדיקות עבר ודוחותיהם ממערכת בריאות אחת, המודל לומד בהדרגה "שפה" משותפת שמקשרת בין דפוסים ויזואליים בתמונות לבין ביטויים בטקסט, ללא צורך בקווי מתאר ידניים או תוויות לכל פריים.

למידה לזהות מחלות כמעט ללא הוראה

לאחר האימון, CMR-CLIP נבדק במשימות קלאסיות שעומדות בפני קרדיולוגים מדי יום, כגון זיהוי ירידה בכושר הכיווץ של הלב, הרחבת חדרים או עיבוי שריר הלב. בהגדרת זירו-שוט, ניתנו למודל רק קלטים קצרים וברורים לקריאה אנושית כגון "החדר השמאלי מורחב" וביקשו מהמודל להחליט אם הם חלים על בדיקה חדשה. אפילו בתנאים אלה, הוא הגיע לדיוק מוצק במספר משימות על שבעה ממצאים נפוצים וכמה מחלות מרכזיות, כולל קרדיומיופתיה היפרטרופית ואמילואידוזיס קרדיאלי. הוא הביס בבירור מערכות תמונה-טקסט כלליות, מה שמראה של-MRI לב יש דפוסים ייחודיים שמודלים כלליים לא תופסים היטב.

משתפר בעזרת רק מעט דוגמאות

הצוות גם ניסה למידה במצבי few-shot, שבה המודל רואה רק מספר מועט של דוגמאות מתויגות לכל מצב לפני שמבקשים ממנו לסווג מקרים חדשים. באמצעות סטי אימון זעירים בגודל של דוגמה אחת, שתיים או ארבע בדיקות לכל קטגוריה, CMR-CLIP השתפר בעקביות ולעתים קרובות השווה או עלה על מודלים שראו הרבה יותר דוגמאות. למשל, בהערכת תפקוד צד שמאל של הלב, הביצועים עלו ממצב הוגן בדוגמה אחת לרמה גבוהה מאוד עם 32 דוגמאות, ותוצאות דומות נצפו עבור הרחבת חדרים ועיבוי שריר. הדבר מרמז כי מרגע שנלמד המרחב המשותף של תמונה-טקסט, המערכת יכולה להסתגל למשימות קליניות חדשות עם הרבה פחות נתוני תיוג מהרגיל.

Figure 2. ה-AI מאחד מבטי MRI רבים של הלב לצינור עיבוד אחד שממיין סריקות לקבוצות המייצגות מצבים לבביים ספציפיים.

איתור סריקות תואמות וטיוטת דוחות

מכיוון ש-CMR-CLIP מקשר תמונות ומילים במרחב משותף, הוא יכול לשלוף את הבדיקה או הדוח הרלוונטיים ביותר כאשר ניתנת לו סריקה או שאילתת טקסט. במבחנים, הוא היה בעל סיכוי גבוה בהרבה מאשר מודלים להשוואה לדרג את הדוח או הסריקה המתאימים בקרבת ראש התוצאות, גם כאשר הנתונים הגיעו מבתי חולים או סורקי MRI שונים. המחברים השתמשו לאחר מכן בתכונות התמונה שנלמדו בשתי דרכים כדי לסייע בדיווח. שיטה אחת פשוטה מוצאת את המקרה העברי הכי דומה ומשתמשת בממצא שלו. שיטה שנייה, שנקראת CMR-TARGET, מזינה את תכונות התמונה למייצר טקסט שכותב ממצא חדש משפט אחר משפט. הגישה הגנרטיבית הזו ייצרה סיכומים שהתאימו יותר לדוחות קליניים אמיתיים לפי מדדים סטנדרטיים של שפה.

חזק מול סורקים ופרטי דימות שונים

החוקרים בחנו כיצד בחירות עיצוב השפיעו על הביצועים. הכללת תמונות נעות מסוג "סינ" ותמונות קונטרסט מיוחדות שמבליטות רקמת צלקת, כמו גם זוויות צפייה מרובות של הלב, שיפרו בבירור את יכולת המערכת לשלוף ולסווג מקרים. שימוש ביותר פריימים לכל בדיקה עזר ללכוד שינויים עדינים לאורך פעימות הלב, אם כי דרש גם משאבי חישוב גבוהים יותר. הצוות הדגיש גם את חשיבות היציבות: הייצוג הפנימי של CMR-CLIP השתנה מעט כאשר פריימים הוסרו או הושחלו, מה שמעיד שהוא מתמקד באותות רלוונטיים למחלות ולא בפרטים שבירים. בדיקות על פני מותגים שונים של סורקים וחוזקות שדה מגנטי הראו שהדיוק נשאר יציב יחסית, רמז לכך שהמודל יכול להכליל מעבר למהמר שבו אומן.

מה זה יכול לשנות בטיפול בלב

בעיני לא-מומחה, המסר העיקרי הוא שמחשבים יכולים כעת ללמוד מושגים עשירים וניתנים לשימוש חוזר מתוך בדיקות MRI של הלב ופירושיהן הכתובים, גם ללא תיוג מפורט על כל תמונה. CMR-CLIP משמש כמודל יסוד המותאם ל-MRI קרדיאלי: הוא יכול לתמוך באבחון של כמה מחלות לב חשובות, לסייע בשליפת מקרים דומים מהעבר ולנסח דוחות מובנים או חופשיים שרופאים יכולים לערוך. בעוד שהוא אינו מחליף קוראים מומחים ועדיין תלוי באיכות ובמגוון נתוני האימון שלו, גישה זו עשויה לקצר את זמן הקריאה, להפוך תוצאות ליותר עקביות בין בתי חולים ובסופו של דבר להרחיב טיפול לב מתקדם מבוסס MRI ליותר מטופלים.

ציטוט: Nakashima, M., Qiu, J., Huang, P. et al. Contrastive language image pretraining for a cardiac magnetic resonance image embedding with zero-shot capabilities. Nat Commun 17, 4416 (2026). https://doi.org/10.1038/s41467-026-73022-2

מילות מפתח: MRI קרדיאלי, AI רפואי, מודל חזון-שפה, קרדיומיופתיה, תמיכה בקבלת החלטות קלינית