Clear Sky Science · he
למידה עמוקה לחיזוי שיעור השכיחות והערכת סיכון קרינה של גידולים מוצקים
מדוע זה חשוב בחיי היומיום

מאגר נתונים אנושי ייחודי וארוך-טווח
המחקר מתמקד ב-Life Span Study, מחקר ארוך טווח על יותר מ-100,000 ניצולים מהפצצות האטום על הירושימה ונגסאקי. עבור כל תת-קבוצה של ניצולים ידוע כמה קרינה הם קיבלו, כמה זמן נמשכו המעקב וכמה גידולים מוצקים התגלו. הכותבים משתמשים בטבלת שנות-אדם (person-year), המסכמת מקרים של סרטן וזמן בסיכון על פני צירופים של גיל, גיל בעת החשיפה, מין, עיר ומינון. מאגר נתונים עשיר זה היה עמוד השדרה של הנחיות להגנת קרינה ברחבי העולם, מה שהופך אותו לשדה ניסוי אידיאלי לשיטות מודלינג חדשות.
כללים ישנים מול מכונות למידה חדשות
באופן מסורתי, סיכון הקרינה בקוהורט הזו הוערך באמצעות מודלים פרמטריים. אלה נשענים על נוסחאות מתמטיות שנבחרו מראש המתארות כיצד הסיכון משתנה עם המינון, הגיל וגורמים נוספים. הם שקופים וקל יחסית לפרשם, אך עלולים להיות שגויים אם הנוסחאות הנבחרות אינן מתאימות לדפוסים האמיתיים בנתונים. לעומת זאת, רשתות עצביות עמוקות לומדות יחסים ישירות מהנתונים באמצעות שכבות מרובות של “יחידות” מקושרות, מבלי להניח צורה מתמטית ספציפית עבור עקומת המענה למינון. המחברים בנו רשת עצבית המקבלת שישה קלטים — שני מדדי גיל, מין, עיר, מיקום בזמן ההפצצה ומינון — ומנבאת שיעורי הופעת גידולים עבור כל תא בטבלת שנות-האדם.
כמה טוב למידה עמוקה מנבאת שיעורי סרטן?
הצוות השווה ארבעה מודלים: מודל "אפס" פשוט המבוסס על ממוצע, מודל ליניארי סטנדרטי, מודל סיכון קרינה פרמטרי מסורתי, והרשת העצבית העמוקה. באמצעות חצוי-אימות חוזר (cross-validation) הם העריכו ביצועים עם כמה מדדי שגיאה סטנדרטיים. הרשת העצבית הציגה את השגיאה הנמוכה ביותר בכל המדדים, אך רק במעט טוב יותר מהמודל הפרמטרי המתקדם. שני המודלים המתקדמים התאימו כמעט באופן הדוק לשיעורי הגידולים המזוהים בתצפיות על פני קבוצות גיל ורוב קטגוריות המינון, אם כי כל אחד הראה אי-התאמות גדולות יותר במינונים הכי גבוהים ובגילאים המבוגרים ביותר. במילים אחרות, למידה עמוקה לא גברה בצורה דרמטית על המודל הקונבנציונלי הטוב ביותר מבחינת חיזוי מספר הגידולים, אך הייתה לפחות זהה ולעתים מעט טובה יותר, במחיר של זמן חישוב ומורכבות הרבה יותר גבוהים.

תמונות שונות של בניית סיכון הקרינה
ההבדל הבולט יותר הופיע כאשר המחברים בחנו את ה־ERR (excess relative risk), דרך מקובלת לבטא עד כמה קרינה מכפילה את הסיכון הבסיסי של אדם לסרטן. באמצעות הרשת הם העריכו ERR עבור כל תא על ידי השוואת שיעורי הגידול החזויים עם ובלי מינון קרינה, כאשר שאר הגורמים מוחזקים קבועים. אף על פי שהרשת והמודל הפרמטרי חזו מספר דומה של גידולים, ערכי ה־ERR שנגזרו היו שונים באופן ניכר על פני טווח המינונים: המודל הפרמטרי נטה לספק אומדנים גבוהים ומפוזרים יותר של ERR. כדי להבין מדוע, החוקרים השתמשו בערכי SHAP, שיטה מבוססת תורת המשחקים המייחס לכל משתנה קלט תרומה לניבויי המודל. עבור שיעורי הגידולים הכוללים, שני המודלים הסכימו שגיל נוכחי, גיל בעת החשיפה, מינון ומין הם ההשפעות החשובות ביותר. אך עבור ה־ERR, הרשת הדגישה את מינון הקרינה כגורם הדומיננטי, כאשר גיל משחק תפקיד תמיכתי קטן יותר, בעוד שהמודל הפרמטרי ייחס תפקיד חזק יותר לגיל בעת החשיפה ולגיל הנוכחי בגלל האופן שבו נוסחתו הוגדרה מראש.
מגבלות, אתגרים ושימושים עתידיים
המחקר מדגיש שלמידה עמוקה, על אף גמישותה, עדיין נותרת "קופסה שחורה" עבור רבים. היא לא מספקת באופן טבעי מספרים מסכמים פשוטים — כמו "עליית סיכון ליחידת מינון" — שאליהם רגילים הרגולטורים, והערכת פסי אי־וודאות לניבוייה היא אתגר טכני, במיוחד בעת שימוש בנתוני person-year מסוכמים. המודלים עלולים גם להתאים ביתר (overfit) לתכונות דקיקות בנתונים אם לא נשלטים בקפידה, והם דורשים הרבה יותר כוח חישובי מאשר גישות מסורתיות. המחברים טוענים שלמידה עמוקה לא צריכה להחליף מודלים פרמטריים מתוכננים היטב, אך יכולה לשמש כתוספת עוצמתית: היא יכולה לחשוף דפוסים לא־ליניאריים או אינטראקציות חבויות ולהציע צורות פונקציונליות טובות יותר למודלים פשוטים יותר שיישארו קלים להבהרה ולרגולציה.
מה משמעות הדבר לבטיחות קרינה
לקורא כללי, המסקנה היא שכלי AI מודרניים יכולים להתאים או לשפר במעט את השיטות המסורתיות כשחוזים שיעורי סרטן הקשורים לקרינה במאגר אנושי מרכזי. עם זאת, הם עשויים לצייר תמונה שונה של אילו גורמים הם המשמעותיים ביותר, ובמיוחד עד כמה הגיל מעצב את סיכון הקרינה. במקום להפוך את הידע הקיים על פניהם, עבודה זו מדגישה כיצד בחירת המודל יכולה להזיז את החשיבות הנתפסת של מינון מול גיל וקוראת לשילוב למידה עמוקה עם מודלים שקופים ומונחי מומחים. בטווח הארוך, גישה היברידית כזו עשויה לתמוך בהנחיות הגנת קרינה מדויקות ואמינות יותר לטיפול רפואי, מקומות עבודה והסביבה.
ציטוט: Liu, Z., Nakamizo, T., Misumi, M. et al. Deep learning for incidence rate prediction and radiation risk assessment of solid tumors. Sci Rep 16, 10577 (2026). https://doi.org/10.1038/s41598-026-46756-8
מילות מפתח: סיכון קרינה, למידה עמוקה, שכיחות סרטן, ניצולי פצצות אטום, מודלינג סיכון