Clear Sky Science · he

אימבידינג ניגודי מבוסס היפרגראף ומיזוג קשב לזיהוי סרטן העור

· חזרה לאינדקס

למה בדיקות עור חכמות חשובות

סרטן העור הוא אחד סוגי הסרטן השכיחים ביותר, ומלנומה, על אף שהיא יחסית נדירה, עלולה להיות קטלנית אם מאובחנת מאוחר. רופאים משתמשים בתמונות מגדילות של נקודות וניתוחים, המכונות תמונות דרמוסקופיות, כדי לאפיין חריגות, אך הרבה נגעים נראים מבלבלים ודומים זה לזה. כמה סוגי סרטן מסוכנים הם נדירים במציאות ולכן מצויים במעט דוגמאות בנתוני האימון של מערכות בינה מלאכותית. המאמר הזה מציג מסגרת ראייה ממוחשבת חדשה בשם C2G‑HFMTA שמטרתה לזהות סרטןי עור באופן אמין יותר, במיוחד המקרים הלא שכיחים אך הקריטיים, וגם לספק הסברים שניתנים לפרשנות על ידי קלינאים.

Figure 1
Figure 1.

לאזן בין כתמים שכיחים ונדירים בעור

מכשול מרכזי בסריקות אוטומטיות של סרטן העור הוא אי־האיזון: כמה נגעים שפירים מופיעים אלפי פעמים במאגרי נתונים, בעוד סרטן חמור או נגעים מזוהים נדירים עשויים להופיע רק כמה עשרות פעמים. מודלים סטנדרטיים של למידה עמוקה נוטים להתמקד ברוב ולהתעלם בשקט מהמחלקות הנדירות — בדיוק ההפך ממה שרופאים מעדיפים. המחברים מתמודדים עם זה באמצעות ארגון מחדש של מאגר הדרמוסקופיה הגדול HAM10000, המכיל יותר מעשרת אלפים תמונות של שבעה סוגי נגעים. האסטרטגיה שלהם, שנקראת Clustered Class‑Based Segmentation, מקבצת תמונות לשלוש אשכולות — מאוד שכיחים, בינוני שכיחים ונדירים — ומוודאת שבמהלך האימון האלגוריתם יתן תשומת לב מובנית לכל קבוצה במקום שירוקן על ידי המקרים הרוביים.

להדריך את המערכת כיצד המקרים קשורים זה לזה

במקום פשוט להזין תמונות לרשת נוירונים ולבקש מהן לשנן דפוסים, המסגרת בונה מפת יחסים מופשטת בין התמונות. באמצעות מחלץ תכונות חזק (DenseNet201), כל תמונת נגע מומרת לטביעת אצבע מספרית. טביעות אלו הופכות לצמתים בגרף שבו הקשרים מראים עד כמה שני נגעים נראים דומים. המחברים הולכים צעד קדימה ומשתמשים ב"היפרגראף", שיכול לקשר מספר תמונות בבת אחת, ובכך ללכוד דפוסי קבוצה עשירים יותר. מעל מבנה זה הם מיישמים סכמת למידה קונטרסטיבית מפוקחת: תמונות מאותה אבחנה נמשכות קרוב יותר במרחב המופשט הזה, בעוד תמונות מאבחנות שונות נדחקות זו מזו. באופן מכריע, התהליך מונחה ישירות על ידי תוויות האבחנה האמיתיות, לא על ידי עיוותים חזקים של תמונה, כך שצבעים וגוונים עדינים וטקסטורות החשובים לאבחון נשמרים.

Figure 2
Figure 2.

לאפשר למשמעות להנחות את הקשב

הרכיב המשפיע השני הוא מודול מיזוג מבוסס קשב שמחבר בין מה שהגרף למד לבין הפרטים הוויזואליים הגולמיים מהתמונות. הייצוגים הנגזרים מהגרף, שמקודדים כיצד כל נגע קשור לאחרים במאגר הנתונים, פועלים כמו "שאלה" ברמה גבוהה לגבי זהות המחלקה. התכונות ברמת הפיקסל מהתמונות המקוריות משמשות כ"ראיות". בתוך בלוק הקשב הרב־מצבי, שני הזרמים האלה מתקשרים: הרמזים הסמנטיים מהגרף מנחים את המודל למקד את הקשב באזורים ובדפוסים בתמונה שחשובים להבחנה בין נגעים שקשה להבדיל ביניהם. חיבורים שאריתיים ועיבוד ברב־סקאלה עוזרים לשמור על פרטים עדינים, כגון שינויים קלים בפיגמנט, אי‑סדירות קצוות או כלי דם קטנים, שלעתים מפרידים בין נגע מסוכן לזה שאינו מזיק.

כמה טוב המודל מתפקד

החוקרים העריכו את המסגרת שלהם על מאגר HAM10000 באמצעות פרוטוקולים ניסויית זהירים, כולל תיקוף צולב בחמישה חלקים והשוואות נרחבות מול יותר מ‑30 מודלים פופולריים מבוססי קונבולוציה ומבוססי טרנספורמר. השיטה שלהם השיגה דיוק כולל של כ‑93% וציון F1 דומה, תוך עלייה משמעותית על כל הקווים הבסיסיים. חשוב לציין שהשיפורים היו החזקים ביותר עבור סוגי הנגעים הנדירים שמרבית המערכות מתקשות איתם. מבחנים נוספים הראו שלכל רכיב — הקיבוץ מבוסס‑המחלקה, האימבידינג הקונטרסטיבי בהיפרגראף ומיזוג הקשב — היה תרומה מדידה לביצועים. כלים חזותיים כמו t‑SNE, UMAP ומפות חום Grad‑CAM הראו שהשיטה החדשה מייצרת אשכולות ברורים יותר של סוגי נגעים וממקדת את הקשב באזורים תמונתיים בעלי משמעות רפואית, כגון גבולות לא סדירים במלנומה או אזורי קרטין דחוסים בנגעים פרה‑סרטניים מסוימים.

מה משמעות הדבר לבדיקות עור בעתיד

במילים פשוטות, המחקר מציג מסגרת בינה מלאכותית שהיא גם צודקת יותר וגם מבדילה יותר בבחינת נגעי עור. על ידי איזון מפורש בין מקרים שכיחים ונדירים, מיפוי יחסים בין תמונות ומתן הנחיה על פי יחסים אלה לאן המודל "מסתכל" בכל תמונה, C2G‑HFMTA משפר משמעותית את האבחון הממוחשב של סרטן העור. למרות שהמערכת עדיין זקוקה לאימות על אוספים קליניים גדולים ומגוונים יותר, היא מצביעה על כלים עתידיים שיכולים לסייע לרופאי עור — ואף לאפליקציות בדיקה ביתיות — לזהות סרטןי עור מסוכנים מוקדם יותר ובביטחון רב יותר, מבלי להתעלם מהמקרים הנדירים שהכי חשובים.

ציטוט: Banerjee, T., Chhabra, P., Kumar, M. et al. Hypergraph-based contrastive embedding and attention fusion for detection of skin cancer. Sci Rep 16, 12808 (2026). https://doi.org/10.1038/s41598-026-43351-9

מילות מפתח: גילוי סרטן העור, דֶרמוֹסקוֹפיה בינה מלאכותית, למידה קונטרסטיבית, אי־איזון בין מחלקות, ניתוח תמונות רפואיות