Clear Sky Science · he

שיפור סיווג סרטן העור עבור מחלקות מיעוט באמצעות ציר ייצור Conditional GAN ואנסמבל CNN‑ViT

· חזרה לאינדקס

מדוע בדיקות עור חכמות יותר חשובות

סרטן העור הוא אחד סוגי הסרטן השכיחים ביותר בעולם, וזיהוי מוקדם שלו יכול להוות את ההבדל בין פרוצדורה פשוטה באמבולטוריה למחלה מסכנת חיים. דרמטולוגים מסתמכים במידה רבה על רמזים ויזואליים בתמונות עור המוקטנות למיקרו, אך גם מומחים מתקשים כשחלק מסוגי הסרטן נדירים והתמונות עמוסות בפרטים מסיטים כמו שיער. במחקר זה מוצג מערכת בינה מלאכותית שנועדה להתמודד בצורה הוגנת יותר עם המקרים הבעייתיים והלא מיוצגים, במטרה לתמוך בסקרי סרטן עור אמינים יותר לכלל האוכלוסייה.

נתונים לא מאוזנים וסרטן שקשה לזהות

תמונות דרמטולוגיות מציבות מספר מכשולים הן למחשבים והן למרפאים. רבות מהתמונות מכילות שערות, צללים ואובייקטים אחרים שמסתירים את הפצע עצמו. חלק מסוגי סרטן העור נפוצים מאוד, בעוד שאחרים נדירים, ולכן מערכי הנתונים הציבוריים העיקריים כוללים אלפי דוגמאות של שומות שפירות אך רק כמה מאות תמונות של סוגים פחות תכופים אך חשובים קלינית. מודלים סטנדרטיים של למידה עמוקה המאומנים על אוספים לא‑מאוזנים כאלה נוטים להצליח בזיהוי מחלקות הרוב ולכשל בשקט במחלקות הנדירות — דווקא המקרים בהם סיוע אוטומטי יכול להיות בעל ערך רב ביותר. בנוסף, רשתות תמונה קונבנציונליות לעתים מתמקדות בחתיכות קטנות ועלולות לפספס רמזים גלובליים כמו אי‑סימטריה כללית או גבולות לא סדירים, שמודדים חשיבות לאבחנה.

Figure 1
Figure 1.

להפיק יותר מהמקרים הנדירים

כדי להתמודד עם חוסר האיזון, המחברים בונים תחילה יוצר תמונות חכם שלומד מנתוני מטופלים אמיתיים ואז מייצר דוגמאות נוספות ומציאותיות של סוגי הפצעים הנדירים. במקום פשוט לשקף או לסובב תמונות קיימות, המערכת שלהם — רשת GAN מותנית — משתמשת ב"מפות תשומת לב" שנגזרות ממסווג סטנדרטי כדי לזהות אילו חלקים בכל פצע השפיעו על החלטות קודמות. מפות התשומת לב מבליטות אזורים בעלי משמעות רפואית. היוצר יוצר אז תמונות חדשות ששומרות על המבנים הקריטיים בתוך אותם אזורים תוך הוספת שינוי מבוקר בצבע, מרקם וצורה. במילים אחרות, ה‑AI לומד לדמיין גרסאות רבות סבירות של כל סרטן נדיר ובכך מעשיר את מאגר האימון מבלי להעתיק תמונות ישירות.

שתי דרכי ראייה: פרטים מקומיים ודפוסים גלובליים

לאחר שהמאגר מאוזן מחדש בעזרת התמונות הסינתטיות הממוקדות, מודול AI שני נכנס לתפקיד האבחון. כאן החוקרים משלבים שני סוגי מודלים משלימים. רשת קונבולוציה (ResNet50V2) מצטיינת בלכידת רמזים מקומיים עדינים — פסי פיגמנט זעירים, מרקם דק וקצוות חדים. במקביל, מודל טרנספורמר חזותי (DeiT) מטפל בכל תמונה כגריד של חתיכות ולומד כיצד אזורים מרוחקים מתקשרים זה עם זה, ותופס תכונות ברמת הפצע כולו כמו סימטריה, פיזור וצורת גבול. במקום לחכות עד סוף התהליך כדי למזג את דעותיהם, הצוות מאחד את הייצוגים הפנימיים שלהם דרך מודול מיזוג מבוסס תשומת לב שמאפשר להקשר הגלובלי להדגיש או להחליש תכונות מקומיות ספציפיות בזמן אמת.

בדיקת המערכת

הצינור הוערך על מאגר HAM10000, אוסף נפוץ של יותר מעשרת אלפים תמונות דרמוסקופיות המשתרעות על שבעה סוגי פצעים, מתחמוצי פיגמנט חסרי סכנה ועד מלנומה וכמה סוגי סרטן עור פחות שכיחים. לאחר הסרת שערות וחלוקת נתונים מדוקדקת בין־אימון לבדיקה, התמונות הסינתטיות החדשות מעורבות עם המקוריות המעודנות ליצירת סט אימון מאוזן. ביצועי המודל המשולב הוערכו באמצעות דיוק פר‑כיתה, רגישות, וציוני F1, וכן עקומות ROC ו‑Precision‑Recall. מהותית, המחברים מתמקדים בשאלה האם מחלקות נדירות כגון דרמטופיברומה, נגעים וסקולריים, קרצינומה תאי בסיס וקרטוזיס אקטינית מזוהות באמינות דומה לסוגים השכיחים, במקום להסתמך על מדד דיוק כולל שיכול להסתיר חולשות.

Figure 2
Figure 2.

תשובות מאוזנות יותר מה‑AI

המערכת שהתקבלה מספקת דיוק גבוה ובעיקר מאוזן היטב על פני כל שבע הכיתות. היא משיגה ביצועים כמעט מושלמים עבור כמה סוגי סרטן מיעוט ומספרים תחרותיים לשאר הסוגים, ובו‑זמנית מציגה אי‑ודאות סטטיסטית נמוכה כאשר נבחנה באמצעות דגימת bootstrap מקיפה. זה מעיד שהשיפורים אינם מזל של דגימת יתר אלא נובעים מהסינרגיה בין ייצור תמונה מונחה תשומת לב לבין המסווג הדו‑מבטי. עבור הקורא הכללי, המסר המרכזי הוא שעיצוב AI חכם — לא רק מודלים גדולים יותר — יכול לסייע להבטיח שכלי סריקה אוטומטיים של סרטן העור לא יתעלמו ממצבים נדירים אך מסוכנים. למרות שנדרש עוד מבחן על מאגרים רחבים ורב‑מרכזיים לפני פריסה קלינית, העבודה מצביעה על סיועי AI שיטפלו בכל פצע עור, נפוץ או נדיר, באותה רמת בחינה.

ציטוט: Hussain, S.R., Saritha, S., Chevuri, A. et al. Enhanced skin cancer classification for minority classes using Conditional GAN pipeline and CNN-ViT ensemble. Sci Rep 16, 13114 (2026). https://doi.org/10.1038/s41598-026-43339-5

מילות מפתח: זיהוי סרטן העור, בינה מלאכותית לתמונות רפואיות, אי‑איזון בכיתות, תמונות רפואיות סינתטיות, טרנספורמרים חזותיים