Clear Sky Science · he

R3MV: ארכיטקטורת מערכת אמינה חדשה לסיווג סרטן העור באמצעות מודל פרוגרסיבי הטרוגני רב‑בלוקים

· חזרה לאינדקס

מדוע המחקר הזה חשוב לעור שלך

סרטן העור הוא בין סוגי הסרטן השכיחים ביותר בעולם, וזיהוי מוקדם עשוי להכריע בין הליך פשוט למחלה מסכנת חיים. רופאי עור פונים יותר ויותר לבינה מלאכותית (AI) כדי לסייע בזיהוי נגעים מסוכנים בתמונות שנלקחו במצלמות ובדֶרמוסקופים. אך אם מערכות AI שונות אינן מסכימות לגבי אותו מוקד בעור, באיזו מהן הרופא צריך לבטוח? המחקר מציג שיטה חדשה לשילוב מספר זוויות מבית מערכות AI להחלטה אחת אמינה יותר האם גידול הוא סרטני.

Figure 1
Figure 1.

הבעיה בביטחון במכונה חכמה יחידה

רוב כלי ה‑AI הקיימים לסרטן העור מתבססים על אימון של מודל עוצמתי אחד על סט נתונים יחיד. מערכות אלה עשויות להיראות מרשימות במבחני מעבדה, אך ביצועיהן נוטים לרדת כשהן נחשפות לתמונות ממרפאות, מצלמות או קבוצות מטופלים אחרות. הערכות קודמות בדרמטולוגיה הדגישו אימות חיצוני חלש וחוסר הכללה: מודלים שעובדים היטב על סט נתונים מסונן עלולים להכשיל במתן תשובות במערכת הבריאות המעשית. מכיוון שתגובה שגויה עלולה לעכב טיפול או לגרום לביופסיות מיותרות, המחברים טוענים כי הסתמכות על מודל יחיד מסוכנת לקבלת החלטות קליניות.

מערכת הצבעות רב‑קולית חדשה

כדי להתמודד עם הבעיה, החוקרים מציעים ארכיטקטורה בת שלוש רמות בשם R3MV, קיצור של Reliable Three‑Level Majority Vote. במקום לשאול מודל AI יחיד, R3MV מעבדת את אותה תמונת עור שלוש דרכי החלטה שונות. המסלול הראשון משתמש ברשת עצבית קונבולוציונית עמוקה שמסווגת את התמונה ישירות. המסלול השני מזין מספר רשתות עמוקות שונות, מאחד את הדפוסים שהן מוצאות ומעביר תכונות מזוקקות לממיין מסורתי. המסלול השלישי בוחן את התחזיות של מודלים בודדים מרובים ומאמן ממיין נוסף על פלטים אלה. בסופו של דבר המערכת מבצעת הצבעה ברוב בין שלושת המסלולים, כך שהפסיקה הסופית משקפת קונצנזוס ולא דעה יחידה.

דרך חכמה יותר לקרוא תמונות של העור

בלב המסלול הראשון עומד מודל תמונה מותאם בשם Progressive Heterogeneous Multi‑Block CNN (PHMBCNN). רשת זו בנויה ממספר בלוקים ממוקדים, שכל אחד מדגיש אספקטים חזותיים שונים של הנגע, כגון מרקמים עדינים או מבנים רחבים יותר, באופן פרוגרסיבי משכבות רדודות לעמוקות. המחברים משפרים עוד את המודל על‑ידי הוספת יחידת זיכרון מסוג Gated Recurrent Unit (GRU), מודול זיכרון המסייע לרשת ללכוד יחסים בין ערוצים ושכבות. הגרסה המשודרגת הזו, PHMBCNN‑GRU, משמשת הן כממיין עצמאי חזק והן כמקור תכונות חיוני לשאר המסלולים במערכת.

לאפשר למספר מודלים ללמוד יחד

המסלול השני מתמקד בשילוב חוזקות של רשתות תמונה מגוונות. אותה תמונת נגע עוברת דרך PHMBCNN‑GRU וכמה מודלים פופולריים מאומנים מראש שפיתחו במקור לתמונות כלליות. כל מודל מפיק את "טביעת האצבע" המממדית‑גבוהה שלו של הנגע. טביעות אלו מאוחדות ואז מדחסות באמצעות טכניקות שמסלקות מידע מיותר או לא מועיל, ומשאירות רק את התכונות המידעיות ביותר. פרספטרון רב‑שכבתי, רשת עצבית שכבתית קלאסית, לומד לאחר מכן לסווג נגעים על בסיס התיאור המשותף המיומן הזה, ובכך ממזג באופן אפקטיבי את מה שכל מודל "רואה" לתוך תצוגה אחת חדה יותר.

Figure 2
Figure 2.

להפוך חילוקי דעות לתשובה חזקה יותר

המסלול השלישי, המכונה מיזוג ברמת ההחלטה, נוקט בפרספקטיבה גבוהה אף יותר. כאן המחברים מתייחסים לכל תווית חזויה של מודל כקלט ומלמדים מכונת וקטור תמיכה (SVM) לזהות דפוסים בהסכמות ובמחלוקות בין המודלים. מטא‑ממיין זה לומד, למשל, מתי שילובים מסוימים של מודלים מצביעים בדרך כלל על נגע שפיר או מתי מודל מסוים נוטה לטעות בסוגי נגעים ספציפיים. בכל שלושת המסלולים החוקרים ביצעו קדם‑עיבוד קפדני לתמונות—שינוי גודל, הסרת ארועי שיער ואיזון קבוצות—כדי לשקף טוב יותר את המציאות הלא מושלמת של תמונות קליניות שצולמו הן בדֶרמוסקופים והן בסמארטפונים.

כיצד המערכת מתפקדת בפועל

הצוות בחן את הגישה שלהם על שני מאגרי תמונות סרטן העור הנפוצים: HAM10000, הכולל תמונות דרמוסקופיות באיכות גבוהה ממרכזים קליניים, ו‑PAD_UFES_20, שמכיל תמונות מסמארטפונים עם ארטיפקטים חזקים יותר כגון שיער צפוף וסימני דיו. דגם PHMBCNN‑GRU המשופר לבדו שיפר את הדיוק בהשוואה לגירסה הבסיסית בשני מערכי הנתונים. החשוב מכל, כאשר כל שלושת המסלולים שולבו בהצבעת רוב במערכת R3MV, הביצועים עלו עוד והגיעו לכ‑99% דיוק על HAM10000 ולכ‑82% בערך על PAD_UFES_20. הסרת שיער מהנגעים שיפרה גם היא בעקביות את התוצאות, מה שמדגיש כמה ניקוי תמונה זהיר הוא קריטי לאבחון אוטומטי.

מה משמעות הדבר לבדיקות עור עתידיות

עבור לא‑מומחים, המסר המרכזי הוא שעבודה זו מעבירה את ה‑AI לסרטן העור מקופסה שחורה יחידה לפאנל של "חוות דעת" עצמאיות שחייבות להסכים לפני שהנגע מסומן כספקני. אמנם R3MV לא פותר לחלוטין את האתגר של לגרום למערכת אחת לעבוד באופן אחיד בכל המרפאות וסוגי המצלמות, אך היא מדגימה כי שילוב מודלים שונים והצבעת רוב ביניהם יכולים להניב תשובות מהימנות יותר מאשר הסתמכות על יחיד. עם הזמן, מערכות רב‑מסלוליות כאלה עשויות לתמוך ברופאי עור על‑ידי הצעת הערכות יציבות, ברורות ואמינות יותר לגבי אילו מוקדים בעור ראויים להתבוננות קרובה יותר או לביופסיה.

ציטוט: Reshma, S.K., Reeja, S.R. R3MV: a novel reliable system architecture for skin cancer classification using progressive heterogeneous multiblock model. Sci Rep 16, 13599 (2026). https://doi.org/10.1038/s41598-026-40522-6

מילות מפתח: איתור סרטן העור, בינה מלאכותית ברפואה העור, אנצמבלים של למידה עמוקה, ניתוח תמונות רפואיות, אבחון בעזרת מחשב