Clear Sky Science · he
מסגרת למידת עומק לאבחון סרטן השד באמצעות Swin Transformer ורשת מיזוג רב‑קנוסקיות עם תשומת לב כפולה
מדוע זה חשוב למטופלות ולרופאים
סרטן השד הוא אחד הסרטן השכיחים ביותר בנשים, והממוגרפיות הן הכלי המרכזי לגילוי מוקדם. עם זאת, קריאת תמונות רנטגן אלה קשה, אפילו למומחים, ואיתותים קטנים עלולים להישמט. מחקר זה מציג מערכת בינה מלאכותית חדשה שנועדה לסייע לרדיולוגים לזהות סרטן השד באופן מהימן יותר על ידי שילוב שתי דרכי "הסתכלות" עוצמתיות על ממוגרמות: אחת שרואה את התמונה המלאה ואחת שמתמקדת בפרטים זעירים.

האתגר של לראות גם את היער וגם את העצים
מערכות בינה מלאכותית מודרניות כבר מסייעות בקריאת תמונות רפואיות, אך רובן נשענות על סוג אחד של מודל. רשתות עצביות מבוססות קונבולוציה טובות בזיהוי דפוסים מקומיים, כמו קצוות חדים או כתמים מבריקים קטנים. ויז'ן טרנספורמרים, משפחה חדשה יותר של מודלים, מצטיינים בהבנת יחסים בכל רחבי התמונה. עם זאת, ממוגרמות דורשות את שתי היכולות בו‑זמנית: סרטן עלול להופיע כגרגירי סידן זעירים או כעיוותים עדינים ברקמה, אך משמעותם תלויה באופן שבו סימנים אלה משתלבים במבנה השד הכולל. במקביל, מערכי נתונים בממוגרפיה בדרך כלל קטנים ולא מאוזנים, עם הרבה פחות מקרים סרטניים מאשר בדיקות תקינות, מה שמקל על מערכות AI להיכנס להטייה או להיתפס להתאמה יתר.
בינה כפולה שמסתכלת לרחוק ומזום לעומק
המחברים מציגים מודל היברידי שהם קוראים לו Swin‑DAMFN, שנבנה במפורש למיזוג ראיה גלובלית ומקומית. אחד הענפים מבוסס על Swin Transformer, שמחלק את הממוגרמה לחלונות ומשתמש במנגנון תשומת לב ללכידת הקשר לטווח ארוך—איך חלקים שונים של השד קשורים זה לזה. הענף השני הוא רשת קונבולוציונית מותאמת אישית, רשת מיזוג רב‑קנוסקיות עם תשומת לב כפולה (DAMFN). ענף זה מותאם לתפוס פרטי על דקים במיוחד כמו מיקרוקלקיפיקציות ועיוותי רקמה עדינים. בתוכו, בלוקים מיוחדים מנתחים את התמונה בסולמות וזוויות מרובות, ואז משתמשים במודולים של תשומת לב כדי להדגיש אזורים שנראים קלינית מידעיים ולדכא רקמת רקע.
לתת למערכת ללמוד עם יותר תמונות ועושר גוונים
מכיוון שמערכי נתוני ממוגרפיה אמיתיים מוגבלים ומוטים לטובת מקרים שאינם סרטניים, החוקרים חיזקו את נתוני האימון בשתי דרכים משלימות. ראשית, הם השתמשו בסוג של מודל גנרטיבי הנקרא GAN מותנה כדי ליצור טלאי ממוגרמה ריאליסטיים, במיוחד עבור קטגוריות ממאירות חסרות ייצוג. תמונות שנוצרו אלה עוזרות לאזן את המחלקות ולחשוף את המודל ליותר וריאציות בהופעת המחלה. שנית, הם יישמו שינויים פוטומטריים—התאמות אקראיות קטנות בהירות, ניגודיות וחידוד—גם על תמונות אמיתיות וגם על סינטטיות. זה מאלץ את ה‑AI להתמקד בדפוסים אנטומיים אמיתיים במקום בתאורה או רעש שטחיים, ומשפר את יכולתו להכליל לסריקות חדשות.

איך החלקים פועלים יחד בזמן האבחון
במהלך הניתוח, ממוגרמה שעברה עיבוד מוקדם מוזנת במקביל לשני הענפים. ה‑Swin Transformer מייצר סיכום קומפקטי של המבנה הגלובלי, בעוד DAMFN מפיק מפת תכונות עשירה מקומית. אלה מיושרים בגודל ונמזגים לייצוג יחיד. בלוק "תשומת לב בשלישייה" קל משקל מעדן עוד את המיזוג הזה על ידי בדיקה צולבת של ערוצים וממדים מרחביים, ומכוון את המוקד של המודל לאזורים שהסבירות להכיל מחלה בהם היא הגבוהה ביותר. לבסוף, ראש סיווג פשוט ממוצע את המידע ומפיק תחזית על פני מספר קטגוריות, כגון רקמה תקינה, ממצאים שפירים או סוגים שונים של נגעים ממאירים.
מה משמעות התוצאות במציאות
הצוות בחן את Swin‑DAMFN על שני מערכי נתונים ציבוריים בשימוש רב, CBIS‑DDSM ו‑MIAS, והשווה אותו מול מודלים פופולריים רבים בלמידת עומק. המערכת שלהם הגיעה לדיוק של כ‑99% על CBIS‑DDSM וכמעט 99% על MIAS, עם רגישות וספציפיות גבוהות דומות (יכולת לתפוס סרטן והימנעות מהתראות שווא). מחקרי אבולוציה זהירים הראו שכל רכיב—הענפים הכפולים, המיזוג המבוסס תשומת לב ואסטרטגיית הגברת הנתונים—תרם לשיפורים אלה. בעוד שהמחברים מציינים שעדיין נדרש בדיקה רחבה יותר על נתוני בתי חולים מגוונים, הממצאים מרמזים שמערכות היברידיות כמו Swin‑DAMFN יכולות להפוך לעוזרים בעלי ערך בסקרינג סרטן השד, לסייע לרדיולוגים לזהות נגעים מסוכנים מוקדם ובאופן עקבי יותר ולהפחית עומס ואי‑ודאות.
ציטוט: Aldawsari, M.A., Aldosari, S.J., Ismail, A. et al. A deep learning framework for breast cancer diagnosis using Swin Transformer and Dual-Attention Multi-scale Fusion Network. Sci Rep 16, 8941 (2026). https://doi.org/10.1038/s41598-026-37969-y
מילות מפתח: סרטן השד, ממוגרפיה, למידת עומק, מודלי טרנספורמר, בינה מלאכותית בהדמיה רפואית