Clear Sky Science · he

למידת עומק טופולוגית עם רב-פוניות לנתונים ביומדיים

2026-04-01 · חזרה לאינדקס

לראות דפוסים מתחת לתמונות רפואיות

בתי חולים מודרניים אוספים כמות עצומה של סריקות, מצילומי רנטגן ועד דימות תהודה מגנטית תלת־ממדית, ואנו סומכים על מחשבים שעוזרים לרופאים לקרוא אותן. מחקר זה מציג דרך חדשה שבה בינה מלאכותית מסתכלת על תמונות רפואיות שלא מסתמכת רק על ערכי פיקסלים, אלא גם על הצורות והזרימות הנסתרות בתוך כל תמונה. המטרה היא להפוך את האבחנות הממוחשבות ליותר מדויקות, אמינות וקלות להבנה.

Figure 1. כיצד עיצוב מחדש של תמונות רפואיות כמשטחים חלקים מסייע למיכשור להפיק תחזיות אבחוניות טובות יותר.

מתמונות למשטחים חלקים

מרבית מערכות ניתוח התמונה מתייחסות לסריקה כמטריצה שטוחה של נקודות צבע. הכותבים טוענים שרבים מהתמונות הרפואיות עדיף לראותן כמשטחים חלקים המתעקלים במרחב, ממש כמו עורת תוף או שלפוחית אוויר. במתמטיקה צורות חלקות אלו נקראות רב־פוניות. בהתייחסות לתמונה כרב־פוניות במקום כמטריצה פשוטה, המודל יכול לתפוס מידע על האופן שבו מבנים מחוברים, היכן הם יוצרים לולאות, וכיצד אזורים שונים נוגעים זה בזה באופן רציף.

להניח לזרימות לחשוף מבנה נסתר

כדי לחקור את נקודת המבט של הרב־פוניות, השיטה בונה קודם כל שדה זרימה מעל כל תמונה, שבו חיצים זעירים מתארים כיצד העוצמה משתנה ממקום למקום. באמצעות ענף במתמטיקה שנקרא תורת הודג׳ (Hodge), הזרימה הזו מפורקת לשלושה חלקים נקיים שאינם מפריעים זה לזה. חלק אחד לוכד מקורות ובורות, חלק שני לוכד תבניות מסולסלות, וחלק שלישי משקף מבנה גלובלי בקנה מידה גדול. התצוגה המשולשת הזו הופכת סריקה גולמית לערכה עשירה של שכבות המדגישות היבטים שונים של אנטומיה ותבניות רקמה.

Figure 2. כיצד תמונה רפואית מחולקת לשלוש תבניות זרימה לפני הכנסתה לרשת עצבית קטנה.

להאכיל קלט חכם יותר לרשת קומפקטית

לאחר עיצוב מתמטי זה, שלושת רכיבי הזרימה נערמים זה על זה ונכנסים לרשת עצבית קונבולוציונית קטנה ומתוכננת בקפידה. בשונה מהרבה דגמי בינה רפואית פופולריים שמכילים עשרות מיליוני משקלים הניתנים להתאמה, רשת זו משתמשת בהרבה פחות ממיליון פרמטרים. על אף גודלה הקומפקטי, היא נהנית מקבלת קלט שכבר מאורגן בהתאם לצורה ולקישוריות, במקום לגרום לרשת לגלות את הדפוסים הללו מאפס. המחברים בדקו את המערכת שלהם על MedMNIST v2, מייצב גדול של יותר מ-700,000 תמונות ביומדיות הכולל פרוסות דו־ממדיות ונפחים תלת־ממדיים ומגוון רחב של איברים, מכשירי הדמיה וסוגי משימות.

תוצאות חזקות על סוגי נתונים רבים

הגישה החדשה עלתה על דגמי למידת עומק מובילים ברוב רובם של 17 מאגרי MedMNIST, כולל גם פרוסות דו־ממד ונפחים תלת־ממדיים. היא הצטיינה במיוחד בתמונות עור, סריקות עיניים, צביעות תאים דם ונתוני איברים ועצבים תלת־ממדיים, והשיגה לעיתים דיוק בולט ודירוג טוב יותר של מקרים חולים מול בריאים. המודל שמר על עמידות כאשר גדלי התמונות השתנו, כאשר מספר דוגמאות האימון היה קטן או גדול, וכאשר מספר קטגוריות האבחון השתנה. בדיקות על אוסף ממצאים של פגעי עור ברזולוציות שונות הראו שהביצועים משתפרים ככל שיש פרטים נוספים, אך גם תמונות ברזולוציה נמוכה טופלו טוב יותר יחסית לשיטות מתחרות.

מדוע הפירוק חשוב

כדי לבדוק האם הפיצול המתמטי אכן מסייע, המחברים חזרו על הניסויים עם רשת כמעט זהה שדלגתה על פירוק הרב־פוניות והזרימה ומשתמשת בתמונות המקוריות ישירות. בכל מקרה, הגרסה עם הפירוק ביצעה טוב יותר, לעיתים בפער ניכר. הדבר מרמז כי שלוש התצפיות המבוססות זרימה לוכדות מידע משלים על מרקם מקומי וצורה גלובלית שפיקסלים רגילים לבדם אינם מספקים, ושהמבנה הזה מקל על הרשת ללמוד דפוסים יציבים.

דרך חדשה לקרוא תמונות רפואיות

במלים פשוטות, עבודה זו מראה כי ללמד בינה מלאכותית לכבד את הצורות והזרימות הבסיסיות שבתמונות רפואיות יכול להניב כלים מדויקים ויעילים יותר לאבחון מבוסס תמונה. על ידי שילוב רעיונות מגאומטריה וטופולוגיה עם רשתות עצביות מודרניות, המחברים מספקים מסגרת שעושה שימוש טוב יותר במידע שכבר קיים בסריקות, תוך שמירה על מודל קטן יחסית. גישת הלמידה הטופולוגית על רב־פוניות עשויה לסייע למערכות עתידיות לקרוא תמונות ביומדיות מורכבות בצורה אמינה יותר, גם כאשר הנתונים מגוונים, מוגבלים או רועשים.

ציטוט: Liu, X., Su, Z., Shi, Y. et al. Manifold topological deep learning for biomedical data. Nat Commun 17, 4710 (2026). https://doi.org/10.1038/s41467-026-71392-1

מילות מפתח: בינה מלאכותית בתדמית רפואית, למידת עומק, ניתוח טופולוגי של נתונים, מיון תמונות, נתונים ביומדיים