Clear Sky Science · he

הזזת הפרדיגמה של מודלי הבסיס לרשתית מפרוסות לנפחים באופטיקה קוהרנטית טומוגרפית

2026-03-05 · חזרה לאינדקס

מדוע זה חשוב לבריאות העין

סריקות עיניים הופכות לכלי קו ראשון לזיהוי מחלות שמסכנות ראייה עוד לפני שהמטופל מבחין בתסמינים. המחקר הזה בוחן גישה חדשה שבה בינה מלאכותית קוראת אחד מהסריקות החזקים ביותר שיש לנו—אופטיקה קוהרנטית טומוגרפיה (OCT)—על ידי טיפול בה לא כתמונה יחידה, אלא כנפח תלת־ממדי דמוי־סרט קצר. המעבר הזה משפר את היכולת של ה-AI לזהות גורמים מרכזיים לעיוורון, ומהווה פוטנציאל לסינון מוקדם ואמין יותר במרפאות ברחבי העולם.

מצילומים שטוחים לתצפיות תלת־ממדיות

OCT מייצרת בלוק תלת־ממדי של הרשתית, המורכב מרבים פרוסות חתך דקות. בשגרה קלינית רופאי עיניים גוללים את כל הנפח הזה כדי לחפש סימני מחלה, כמו משקעים זעירים בניוון מקולרי הקשור לגיל (AMD) או שינויים מבניים עדינים בגלאוקומה. עם זאת, רוב “מודלי הבסיס” הקיימים להדמיית רשתית מתעלמים ממבנה תלת־הממד העשיר הזה. הם בדרך כלל מסתכלים רק על פרוסה מרכזית אחת, מתוך ההנחה שהיא מכילה את המידע החשוב ביותר. המחברים טוענים שקיצורי דרך זה זורק החוצה חלק ניכר ממה שהקלינאים משתמשים בו בפועל, ואולי זה אחד הגורמים לכך שמערכות ה-AI עדיין נאבקות להגיע לצרכים אבחוניים בעולם האמיתי.

שיתוף רעיונות מניתוח וידאו

במקום להתייחס ל-OCT כתמונה בודדת, החוקרים מתייחסים אליה כאילו היא וידאו קצר: רצף פרוסות המתקדם לעומק הרשתית. הם מאמצים מודל בסיס מתקדם לניתוח וידאו בשם V-JEPA, שאומן במקור על וידאוים טבעיים יומיומיים, ומתאימים אותו ל-OCT. כמו מערכות AI מודרניות אחרות, V-JEPA עובר תחילה אימון ללא השגחה (self-supervised), בו הוא לומד לחזות ולהשלים מידע חסר ללא תוויות. זה מייצר "אוצר מילים" חזותי כללי שהמודל יכול להשתמש בו לאחר מכן. החוקרים לאחר מכן מבצעים כוונון עדין (fine-tuning) של V-JEPA על מערכי נתוני OCT מתויגים קטנים יותר כדי שיזהה בין עיניים בריאות לעיניים חולות.

בדיקות בין מדינות ומחלות

כדי לבדוק האם הגישה התלת־ממדית אכן עוזרת, הצוות השווה את V-JEPA מול שלושה מודלי בסיס חזקים מבוססי תמונה, כולל שניים שאומנו במיוחד על תמונות רשתית ואחד שאומן על צילומים טבעיים. כל המודלים השתמשו בארכיטקטורות רשת עצבית דומות, כך שההבדלים בביצועים משקפים בעיקר את אופן השימוש בנתונים, לא את גודלם או מורכבותם. נתבקשו המודלים לזהות שתי מחלות עיניים עיקריות—נוירופתיה אופטית גלאוקומתית (צורת גלאוקומה) ו-AMD—על סמך חמישה מערכי נתוני OCT עצמאיים שנאספו בארצות הברית, סין, ישראל ואיראן, המכסים סורקי חישה שונים, אוכלוסיות ודפוסי מחלה משתנים.

תשובות ברורות יותר מתוך מידע תלת־ממדי מלא

בכל מערכי הנתונים הללו, הווידאו־מבוסס V-JEPA התאמה או עלה על כל המודלים המבוססי תמונה, והשיג ממוצע שטח תחת עקומת ROC של 0.94 לעומת 0.90 עבור המודל הטוב ביותר על פרוסה אחת—שיפור מובהק סטטיסטית. היתרון היה הגדול ביותר בחלק מהקבוצות המאתגרות יותר, שבהן היה קשה להפריד בין מקרים חולים ללא חולים. ניתוח מפות הקשב של המודל הראה ש-V-JEPA מתמקד במבנים רלוונטיים המפוזרים על פני פרוסות מרובות, ולא רק בפרוסה המרכזית. ניתוח שגיאות חשף שמודלים על פרוסה אחת לעתים קרובות החמיצו מקרים שבהם הפתולוגיה נעדרת או עדינה בפרוסה האמצעית אך נוכחת במקומות אחרים בנפח. על ידי הגדלת הכיסוי המרחבי ולמידת הקשרים בין פרוסות, המודל התלת־ממדי תפוס טוב יותר דפוסים אלה.

איזון בין ביצועים לפרקטיקה

המחברים השוו גם את V-JEPA לדרכים אחרות לשימוש במידע תלת־ממדי, כמו רשתות קונבולוציה תלת־ממדיות קלאסיות המאומנות מאפס ושיטה "2.5D" שמעבדת פרוסות רבות אחת אחרי השנייה עם מודל תמונה ואז משלבת את התוצאות. V-JEPA בדרך כלל עלה על האלטרנטיבות הללו תוך צורך בחישוב פחות מאשר אסטרטגיית ה-2.5D. חשוב שהיתרונות שלו נשמרו גם כאשר היו זמינים רק כמויות צנועות של נתוני תיוג, וביצועיו המשיכו להשתפר ככל שמספר דגימות האימון גדל, בעוד שמודלים מבוססי תמונה נטו להגיע לרוויה. אף על פי שעיבוד נפחים איטי יותר מקריאת פרוסה בודדת, זמן העיבוד הנוסף נשאר קטן—בסדר גודל של מאיות שניה לסריקה על חומרה מודרנית.

מה משמעות הדבר לטיפול בעיניים בעתיד

עבור לא־מומחים, המסקנה פשוטה: לאפשר ל-AI לראות את הרשתית בתלת־ממד, כפי שעושים הקלינאים, מוביל לזיהוי אוטומטי מדויק יותר של מחלות משתקות שכיחות. עבודה זו מצביעה על כך שמודלי הבסיס העתידיים להדמיית עיניים צריכים להיות תוכננו מההתחלה כדי לטפל בנפחי OCT מלאים, לא רק בתמונות בודדות. בצירוף שיתוף נתונים רחב יותר ובסופו של דבר אינטגרציה עם מידע קליני נוסף, מודלים כאלה יכולים לסייע להביא סינון עקבי ואיכותי לגלאוקומה ולניוון מקולרי למרפאות ולחולים רבים יותר ברחבי העולם.

ציטוט: Judkiewicz, R., Berkowitz, E., Meisel, M. et al. Shifting the retinal foundation models paradigm from slices to volumes for optical coherence tomography. npj Digit. Med. 9, 314 (2026). https://doi.org/10.1038/s41746-026-02496-7

מילות מפתח: אופטיקה קוהרנטית טומוגרפיה, בינה מלאכותית בהדמיית רשתית, ניוון מקולרי הקשור לגיל, איתור גלאוקומה, מודלי בסיס לוידאו