Clear Sky Science · he

ביצועי אלגוריתמים לחיזוי סיכון לסרטן השד בין מערכות ממוגרפיה בתוכנית הסקירה של בריטניה

· חזרה לאינדקס

מדוע זה חשוב לנשים ולמשפחות

סקרי שד מצילים חיים על ידי גילוי גידולים בשלבים מוקדמים, אך רבים מהגידולים מופיעים בשנים שבין ממוגרפיות שגרתיות ולעתים במצב מתקדם יותר. המחקר בוחן שאלה פשוטה אך חשובה: האם בינה מלאכותית (AI) יכולה לקרוא ממוגרפיה שנראית “נורמלית” ולסמן בשקט נשים שבפועל נמצאות בסיכון גבוה לטווח הקצר, כדי שיוצעו להן בדיקות נוספות לפני שהסרטן יגדל ויתפשט?

Figure 1
Figure 1.

לראות יותר בממוגרפיה נורמלית

מרבית תוכניות הסקר הלאומיות, כולל זו של בריטניה, מזמנות נשים לממוגרפיה כל שלוש שנים. אם לא נראית חשד כלשהו, נמסר להן שהבדיקה “שלילית” והן חוזרות לשגרה. עם זאת, כ־30% מהסרטן בשד בקרב נשים שעברו סקר הם "סרטן אינטרוול" שמופיע בין ביקורים מתוזמנים ונוטה לנבא תוצאה גרועה יותר. לאחרונה, מערכות AI עוצמתיות למדו לסרוק ממוגרפיות שנראות נורמליות לקוראים האנושיים ולהקצות לנשים ציון סיכון לטווח הקצר. הרעיון הוא להשתמש במידע החבוי הזה כדי להתאים את תדירות הבדיקות ואת מי צריך להציע לו בדיקות רגישות יותר כמו MRI או ממוגרפיה משופרת בניגוד (contrast‑enhanced).

בחינת ארבעה כלים של AI

החוקרים בחנו 112,621 ממוגרפיות סקר שליליות משני אתרי תוכנית סקר השד של ה‑NHS באנגליה, המכסה סבב שלם של שלוש שנים בין 2014 ל‑2017 ומעקב נשים למשך חמש שנים. שני האתרים השתמשו במכונות ממוגרפיה דיגיטליות שונות (Philips ו‑GE), המשקפות שונות המציאותית. במהלך המעקב, 1,225 נשים פיתחו סרטן שד, כולל 396 סרטן אינטרוול וגידולים נוספים שהתגלו בסבב הסקר הבא. ארבעה אלגוריתמים מובילים לחיזוי סיכון—שלושה מסחריים ואחד אקדמי—רוצו מקומית על כל ממוגרפיה ליצירת ציון סיכון לעתיד, וביצועיהם הושוו.

כמה טוב האלגוריתמים זיהו גידולים עתידיים

כל ארבעת מערכות ה‑AI היו מסוגלות להבחין, טוב יותר מאשר במקרה, בין נשים שיפתחו לבין אלה שלא יפתחו סרטן, אך הן לא הופיעו שוות בביצוען. אלגוריתם אחד (מסומן DL‑1) הראה בהתמדה את ביצועי החזקים ביותר, בעוד שאחר (DL‑3) נותר מאחור. כאשר הצוות התרכז בסרטן אינטרוול—אלה שמופיעים זמן קצר לאחר סריקה “נורמלית”—הדגם הטוב ביותר הגיע לרמות דיוק הדומות או טובות יותר ממחקרים קודמים שהשתמשו באלגוריתם יחיד. חשובה לא פחות, שלושה מתוך ארבעת הכלים פעלו בצורה דומה על תמונות של Philips ו‑GE, מה שמרמז שהם יכולים להתמודד עם לפחות חלק מההבדלים בחומרת הסריקה, אף על פי שאלגוריתם אחד הראה ביצועים נמוכים משמעותית על מערכת אחת.

מה קורה אם נפעל לפי ציוני הסיכון הגבוהים ביותר?

השאלה המעשית עבור שירותי הסקר היא כמה נשים לזמן חזרה על פי ציוני ה‑AI. לכן החוקרים בחנו נקודות חיתוך בעלות משמעות קלינית. אם רק 4% הנשים בסיכון הגבוה ביותר (לפי ציוני כל כלי) היו נבחרות לתשומת לב נוספת, שני האלגוריתמים הטובים ביותר יחד לכדו כ‑20% מכלל הסרטנים העתידיים ויותר מרבע מסרטני האינטרוול. כאשר ההסתייגות הוסרה כדי לכלול את 14% העליונים של ציוני הסיכון—קרוב לשיעורי זימון שניכרים בכמה תוכניות בצפון אמריקה—התשואה הוכפלה בערך: המודל החזק ביותר זיהה סביב 42% מכלל הסרטנים העתידיים וחצי משרתי האינטרוול. עם זאת, כל אלגוריתם נטה לסמן תת‑קבוצה שונה במידה מסוימת של גידולים, עם חפיפה יחסית מועטה, דבר המרמז שאנסמבל של כלים או אסטרטגיות מרובות‑כלים עשויות למצוא יותר גידולים מכל דגם בודד.

Figure 2
Figure 2.

חוזקות, פערים והשלבים הבאים

העבודה בולטת בכך שהיא משתמשת בנתונים שוטפים שלמים משני מרכזי סקר NHS גדולים במקום במדגם מחקר מצומצם נבחר, והיא הראשונה שמעריכה מספר כלים ידועים לחיזוי סיכון זה לצד זה בהקשר הבריטי. יחד עם זאת קיימים מגבלות. נשים עם שתלים או דימויים בראיות לא־סטנדרטיות הוצאו מן המחקר, והמחקר כיסה רק שתי חברות ממוגרפיה, כך שהביצועים על ציוד אחר או באוכלוסיות אתניות שונות נותרו לא ודאיים. מכיוון שהניתוח היה רטרוספקטיבי, חלק מהגידולים שייתכן והיו מתגלים מוקדם יותר באמצעות הדמיה נוספת מבוססת סיכון לא נכללו, כלומר התועלת האמיתית עשויה להיות גדולה יותר מהמדווח.

מה משמעות הדבר לעתיד סקר השד

לקורא כללי, המסקנה היא כי AI מודרני יכול אכן למצוא סימני אזהרה בממוגרפיות “נורמליות” שמנבאים אילו נשים סביר שיוכלו לפתח סרטן שד בקרוב, במיוחד סרטן אינטרוול שקשה לתפוס בשלבים מוקדמים בדרך אחרת. האלגוריתמים החזקים ביותר יכלו, עקרונית, לאפשר לתוכניות הסקר להציע בדיקות תכופות יותר או רגישות יותר לקבוצה יחסית קטנה של נשים בסיכון גבוה, בעוד שאחרות ימשיכו בבדיקות שלוש‑השנה הסטנדרטיות. עם זאת, ההבדלים בין הכלים ובין מערכות ההדמיה מראים שאין דגם AI יחיד מוכן לאימוץ אוניברסלי ללא בדיקות קפדניות. המחברים טוענים שיש לערוך ניסויים פרוספקטיביים גדולים המשתמשים במספר אלגוריתמים, יחד עם כוונון מקומי עבור סורקי ותושבי אוכלוסייה, לפני ששילוב סקר מבוסס סיכון מונחה AI יהפוך לטיפול שגרתי ובטוח.

ציטוט: Rothwell, J., Payne, N., Kilburn-Toppin, F. et al. Performance of breast cancer risk prediction algorithms across mammography systems in the UK screening programme. npj Digit. Med. 9, 330 (2026). https://doi.org/10.1038/s41746-026-02507-7

מילות מפתח: סריקות סקר לסרטן השד, בינה מלאכותית, ממוגרפיה, חיזוי סיכון, סרטן אינטרוול