Clear Sky Science · he

סגמנטציה פדרטיבית של נודולים ריאתיים באמצעות ארכיטקטורת היברידית טרנספורמר–U-Net

· חזרה לאינדקס

למה חשוב לזהות נקודות זעירות בריאה

סרטן הריאה הוא הסרטן הקטלני ביותר בעולם, ובכל זאת האיתותים המוקדמים ביותר שלו — נקודות זעירות הנקראות נודולים בסריקות CT — קל להחמיץ. רדיולוגים צריכים לעבור אלפי תמונות מפורטות, ושיתוף נתוני מטופלים בין בתי חולים כדי לאמן מחשבים חכמים נחסם לעתים קרובות על ידי תקנות פרטיות מחמירות. מחקר זה מציג שיטה שמאפשרת לבתי חולים לשתף פעולה כדי ללמד מערכת בינה מלאכותית (AI) לזהות נודולים ריאתיים בדיוק גבוה, בלי להחליף מעולם את הסריקות הגולמיות של מטופלים.

לשתף ידע בלי לשתף סריקות

מכשירי CT מודרניים יכולים לתעד פרטים בריאה עד שברים של מילימטר, אך הדיוק הזה יוצר הצפת תמונות שאף אדם לא יכול לסרוק לבד. כלים מסייעים ממוחשבים יכולים לעזור, אבל הם זקוקים למאגרי נתונים גדולים ומגוונים כדי לא להחמיץ נודולים יוצאי דופן. חוקים כמו HIPAA ו-GDPR מונעים מבתי חולים פשוט לאגד את נתוני המטופלים במקום אחד. הכותבים משתמשים באסטרטגיה שנקראת למידה פדרטיבית כדי לפתור את הדילמה הזו. כל בית חולים מאמן עותק של אותו מודל מקומית על סריקות ה-CT שלו ושולח רק את הפרמטרים של המודל שלמד — לא את התמונות עצמן — לשרת מרכזי. השרת מממץ את הפרמטרים האלה למודל "גלובלי" משופר ושולח אותו חזרה, מה שמאפשר לכל אתרים להרוויח מניסיונם של האחרים תוך שמירת נתוני המטופלים במקום.

Figure 1
Figure 1.

ניקוי התמונות לפני הלמידה של ה-AI

המחקר מתמקד בנודולים ריאתיים "מוצקים" בטווח 15–25 מ״מ, שהם בעלי חשיבות קלינית אך תופסים רק כמה פיקסלים בכל חתך CT, מה שקל למחשבים להתעלם מהם. לפני תחילת הלמידה, כל חתך CT עובר תהליך ניקוי בשני שלבים. ראשית, שיטה לשיפור ניגודיות בשם CLAHE מבהירה נודולים חלשים בלי להגביר רעש, מה שמבליט נקודות עדינות בצורה ברורה יותר. שנית, התמונות מפוענחות מחדש כך שכל ערכי הפיקסל יהיו בטווח של 0 עד 1, מה שנותן למודל סקאלת בהירות עקבית בין סריקות ממכונות ובתי חולים שונים. תהליך קדם‑עיבוד מאוחד זה מסייע ל-AI להתמקד בנודולים זעירים ובעלי ניגוד נמוך במקום להסתבך בהטיות של הסורק.

שילוב שתי דרכי ראייה: פרט סמוך והקשר רחב

בלב המערכת עומד רשת היברידית המשלבת שתי רעיונות חזקים מה-AI המודרני: U-Net, שמצטיין בסימון עצמים בתמונה, וטרנספורמר, שפותח במקור לשפה אך נמצא כיום בשימוש נרחב בראייה ממוחשבת. החלק בצורת U של המודל מדחס תחילה את התמונה דרך שכבות של פילטרים קטנים שמבררים טקסטורה מקומית — קצוות, נקודות וגבולות עדינים — ואז משחזר מסכת גודל מלא שמסמנת אילו פיקסלים שייכים לנודול. חיבורים שורשיים וקיצוץ-דלג (skip links) נשאים פרטים עדינים ברשת כדי שלא יאבדו. באמצע הצורה הזו נמצא "צוואר" טרנספורמר שטורק פתיחות של התמונה כטוקנים במשפט, ומשתמש בקשב עצמי כדי לקשר אזורים רחוקים. זה מאפשר למודל לראות גם את הנודול הזעיר וגם את סביבתו האנטומית הרחבה, מה שקריטי כשנודולים משתלבים בכלי דם סמוכים או מבני חזה.

Figure 2
Figure 2.

טיפול במטרות נדירות ובנתונים לא מאוזנים

הכותבים מתמודדים גם עם בעיה מרכזית בהדמיה רפואית: חוסר איזון בכיתות. בסריקות CT של הריאה כמעט כל פיקסל הוא רקע; פיקסלים של נודול נדירים. אימון סטנדרטי נוטה לתגמל מודלים שמסמנים פשוט את הכל כרקע. כדי להתגבר על כך, הצוות משלב שתי פונקציות אובדן — Dice loss, שמתוגמלת ישירות על חפיפה בין הנבואה והאמת, ו-Focal loss, שמעניקה דגש נוסף לפיקסלים שקשים לסיווג. התערובת הזו של Dice–Focal מעודדת את המודל לשים לב לנודולים קטנים וקשים ולגבולות חדים. בסביבת הפדרציה שלהם עם חמישה "קליינטים" סימולטיביים של בתי חולים שאימנו על מאגר LUNA16 הציבורי, המערכת השיגה ציוני Dice עד 0.93 לנודולים מוצקים והציגה שיעורים נמוכים של נודולים מפוספסים והתראות שווא. הביצועים נשארו חזקים ברוב הקליינטים למרות הבדלים באיכות התמונות ובמראה הנודולים, אם כי נודולים בעלי צפיפויות מטושטשות או מעורבות נשארו אתגריים.

מה המשמעות לכך עבור סריקות ריאה בעתיד

בפשטות, עבודה זו מראה שבתי חולים יכולים לאמן במשותף מערכת AI איכותית לזיהוי נודולים בלי לשלוח מעולם סריקות מטופלים דרך הרשת. באמצעות שילוב של ניקוי תמונה מוקפד, מודל שרואה גם פרטים וגם הקשר, ואסטרטגיית אימון המותאמת למטרות נדירות, המסגרת מתארת נודולים ריאתיים מוצקים באופן אמין בהגדרה רב‑בתי חולים ריאליסטית. בעוד שיש צורך בעבודה נוספת כדי להתמודד עם נודולים חלשים או חלקית־מוצקים, המחקר מפנה לכיוון של כלי סקריןינג לסרטן ריאה שהן מדויקים והן מגנים על פרטיות — מביאים את היתרונות של בינה מלאכותית הגדולה למטופלים בלי לפגוע בסודיות התמונות הרפואיות שלהם.

ציטוט: Turjya, S.M., Fawakherji, M. Federated lung nodule segmentation using a hybrid transformer–U-Net architecture. Sci Rep 16, 5228 (2026). https://doi.org/10.1038/s41598-026-35243-9

מילות מפתח: מניעת סרטן ריאה, סגמנטציה של תמונות רפואיות, למידה פדרטיבית, נודולים ריאתיים ב-CT, בינה מלאכותית המגנה על פרטיות