Clear Sky Science · he
סיווג מדויק של נגעי עור בתמונות דרמוסקופיות לא מאוזנות עם שונות גבוהה באמצעות מסגרת SCTFD
מדוע בדיקות עור חכמות חשובות
סרטן העור הוא אחד מהסוגים השכיחים ביותר של סרטן, אך גם אחד הניתנים לריפוי בקלות יחסית אם תופסים אותם מוקדם. רופאי עור מסתמכים יותר ויותר על צילומים מקרובים של שומות וכתמים, שצולמו באמצעות מגדיל הנקרא דרמוסקופ, כדי להחליט אילו מהם מסוכנים. עם זאת, קריאת תמונות אלה קשה, אפילו למומחים, ומערכות ממוחשבות שעשויות לסייע נוטות להיתקל בקשיים מאחר וסוגי סרטן מסוימים נדירים ונגעים יכולים להיראות שונה מאוד ממטופל למטופל. המחקר מציג מסגרת בינה מלאכותית חדשה בשם SCTFD, שנועדה להפוך את סיווג נגעי העור שמבוצע על ידי מחשב לברי-אמינות ומדויק במיוחד במצבים קשים אלה.

האתגר של כתמים עוריים נדירים ומסובכים
אוספי תמונות עור בעולם האמיתי רחוקים מאיזון. שומות שכיחות, ברובן חסרות-מפגע, מופיעות אלפי פעמים בנתוני אימון, בעוד כי סרטן חמור כמו מלנומה או גידולים נדירים מופיעים רק כמה מאות פעמים או פחות. במקביל, נגעים מאותה מחלה יכולים להשתנות במידה רבה בגודל, בצבע ובצורה. מערכות AI סטנדרטיות נוטות להילכד בדפוסים השכיחים ולהתעלם מהנדירים, מה שעלול להיות מסוכן ברפואה: עדיף לפספס שומה תמימה מאשר מלנומה. אסטרטגיות קלאסיות, כמו שכפול פשוט של תמונות נדירות או ערבובן, או שימוש במודלים גנרטיביים מורכבים, מוגבלות במציאותיות, ביציבות או בעלות חישובית. SCTFD נבנתה במיוחד לטפל באי־האיזון והשונות הזו תוך שמירה על יעילות פרקטית.
יצירת דוגמאות אימון טובות יותר
בלוק הבנייה הראשון של SCTFD הוא מחולל נתונים הנקרא CN-SMOTE. במקום לבצע פשוט אינטרפולציה של ערכי פיקסלים או לאמן רשת GAN פגיעה, CN-SMOTE משתמש בזוג מקודד־מפענח: רשת אחת מדחסת תמונת דרמוסקופ למצב קוד פנימי מרוכז, והשנייה משחזרת אותה חזרה לתמונה. לאחר שלומדת המרחב המרוכז הזה, השיטה מוצאת שכנים קרובים בקרב נגעים ממחלקות נדירות ומבצעת אינטרפולציה בין הקודים שלהם, ואז מפענחת את הקודים המעורבים חזרה לתמונות חדשות. עונש אימון מיוחד שומר על כך שקודי הפנים של נגעים מאותו סוג יישארו קרובים זה לזה, כך שהתמונות הסינתטיות יישארו ריאליסטיות ונאמנות למחלה הבסיסית. התוצאה היא אוסף גדול ומאוזן יותר של תמונות דרמוסקופיות שבו סוגי נגעים נדירים אך חשובים מיוצגים טוב יותר.
לראות גם פרטים וגם את התמונה הגדולה
הרכיב השני, MARD-Net, מתמקד בהמרת כל תמונה לערכת תכונות עשירה. שכבות קונבולוציה מתפקדות כמו עדשות מתכווננות שמקלטות דפוסים עדינים כגון גבולות ומרקמים. מעל לכך, מודול תשומת לב מלמד את הרשת למקד את עצמה באזור הקטן שבו נמצא הנגע בפועל, ולהמעיט את חשיבות העור הבריא שסביבו שעשוי להסיח את המודל. לבסוף, שלב מבוסס Transformer סורק את כל התמונה כדי ללכוד יחסים בין חלקים מרוחקים של הנגע, כמו האופן שבו צבעים ומבנים שונים מסודרים. כדי להימנע מהחישוב הכבד שמגיע בדרך כלל עם Transformers, המחברים מציעים אסטרטגיית חלון החלקה שמאפשרת למודל לקבל מבט רחב על הנגע תוך ביצוע חישובי תשומת לב ממוקדים באזורים נבחרים בלבד, מה שעושה אותו מהיר וחסכוני יותר בזיכרון.

הנחיית המודל להתייחס לכל מחלקה בהגינות
העמוד השלישי של SCTFD הוא מטרה אימונית חדשה הנקראת FDLoss, שמנחה את ה‑AI כיצד לכוונן את עצמו במהלך הלמידה. במקום לספור כל תמונה באותה מידה, FDLoss מדגיש מקרים קשים ונדירים כדי שהמודל לא יוכל פשוט "לנסוע" על ביצועים טובים בדוגמאות השכיחות והקלות. הוא מערבב רעיונות משני כללי ניקוד פופולריים: אחד שמתגמל איזון טוב בין רגישות לדיוק, ואחר שמוריד משקל לדוגמאות טריוויאליות שהרשת כבר מסווגת נכון. בנוסף לכך, FDLoss מוסיף רכיב שמעודד תמונות מאותה מחלה להתרכז בקבוצות צפופות במרחב הפנימי של המודל, בעוד שהוא דוחף מחלות שונות זו מרחוק. צירוף זה נלחם ישירות הן באי־האיזון בין מחלקות והן בשונות הגדולה בתוך כל מחלקה שמבלבלת סיווגים בדרך כלל.
כמה טוב המתודולוגיה החדשה עובדת
המחברים בדקו את SCTFD על שני מאגרי מבחן בינלאומיים נפוצים לצילום עור, ISIC 2018 ו‑ISIC 2019, המכילים עשרות אלפי תמונות דרמוסקופיות קליניות אמיתיות בחמש ושמונה סוגי נגעים בהתאמה, והם מוטים חזק כלפי שומות שכיחות. בהשוואה למספר שיטות מתקדמות, SCTFD השיגה דיוק גבוה יותר ואיזון בולט יותר בין תפיסת חיוביים אמיתיים והימנעות מאזהרות שווא. היא שיפרה את הדיוק הכולל לכ‑93% בשב ISIC 2018 ולכ‑91% ב‑ISIC 2019, והרימה את ציון F1 — מדד שמאזן החמצות וסיווג שגוי — מעל כל המערכות המתחרות. המחשות ויזואליות הראו כי מודולי התשומת לב מתקמרים בדיוק לאזורי הנגע וכי התכונות של מחלות שונות מופרדות בצורה נקייה יותר לאחר האימון.
מה משמעות הדבר עבור מטופלים ורופאים
בעבור מטופלים, ההבטחה של SCTFD היא חוות דעת שנייה אמינה יותר כאשר מופיע כתם חשוד על העור. על ידי סינתזה של דוגמאות ריאליסטיות של סרטן נדיר, מיקוד בחלקים המידעיים ביותר של כל תמונה ואימון עם פונקציית הפסד שמכריחה הפרדה ברורה בין סוגי מחלות, המסגרת מפחיתה את הסיכון שמערכות אוטומטיות יתעלמו מנגעים מסוכנים רק מפני שהם נדירים או בלתי טיפוסיים. למרות שהיא אינה מחליפה את שיקול דעתו של דרמטולוג, גישה זו עלולה להוריד את החסם לאבחון מוקדם ומדויק במרפאות ובפלטפורמות טלה־רפואה, ובכך לתפוס מקרי סרטן עור מסכני חיים מוקדם ובהרבה עקביות רבה יותר.
ציטוט: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8
מילות מפתח: זיהוי סרטן העור, בינה מלאכותית בדרמוסקופיה, מיון תמונות רפואיות, מערכי נתונים לא מאוזנים, למידה עמוקה בדרמטולוגיה