Clear Sky Science · he

השפעת השימוש בבינה מלאכותית כקורא שני בסקר שדיים כולל בורר

· חזרה לאינדקס

מדוע המחקר הזה חשוב לנשים ולמשפחות

סריקת השד היא אחד הכלים הנפוצים ביותר לאיתור מוקדם של סרטן, כאשר הטיפול יעיל ופחות אגרסיבי. עם זאת, המערכת מסתמכת על כוח אדם גדול ומיומן של מומחים שבודקים תמונות ממוגרפיה בעין. בממלכה המאוחדת אין מספיק רדיולוגים כדי לענות בנוחות על הביקוש, מה שמעלה חששות מעיכובים וממקרים של סרטן שייתכן וייעלמו. המחקר שואל שאלה שמשפיעה על מיליוני נשים: האם מערכת בינה מלאכותית (AI) יכולה לקחת בבטחה חלק מעבודת הקריאה בצד המומחים האנושיים מבלי לפגוע בדיוק — ואולי אפילו לסייע לאתר סרטן מוקדם יותר?

Figure 1
Figure 1.

כיצד עובדת סקרת השד היום

במסגרת תכנית סקר השד של שירות הבריאות הלאומי, נשים בגיל 50 עד 70 מוזמנות לבצע ממוגרפיה כל שלוש שנים. כל סט תמונות נקרא בדרך כלל באופן עצמאי על ידי שני קוראי ממוגרפיה מיומנים, כגון רדיולוגים או רדיוגרפים מתמחים. אם השניים אינם מסכימים, או אם המדיניות המקומית מחייבת זאת, המקרה עובר לדיון מיוחד הנקרא בורר, שבו הקוראים מחליטים יחד אם לזמן את האישה לבדיקות נוספות. מערכת הקריאה הכפולה מיועדת לאזן בין שני יעדים: לאתר כמה שיותר מקרי סרטן ולמנוע זימונים מיותרים שגורמים לחרדה, לבדיקות נוספות ולעלויות.

מה החוקרים ניסו לבחון

הצוות בדק ממוגרפיות ותיקי חסרונות קליניים של 50,000 נשים שסוקרו בשתי יחידות בית חולים בלונדון. מאחר שלנשים אלה היה מעקב של כמה שנים, החוקרים יכלו לראות לא רק אילו סרטן נתפסו בסקר, אלא גם אילו הופיעו אחר כך בין בדיקות הסקר (מה שמכונה סרטן אינטרוול) או בביקור השגרתי הבא. הם השוו שני מסלולים באמצעות אותן תמונות היסטוריות: הגישה הסטנדרטית עם שני קוראים אנושיים, וגישה בסיוע AI שבה הקורא הראשון היה אנושי והקורא השני היה מערכת ה-AI שפותחה על ידי Google. כל מקרים שדרשו החלטה סופית הועברו לפאנלים של בורר שכללו 22 קוראים מנוסים, שעבדו כפי שהיו עובדים במרפאות אמיתיות.

כיצד ה-AI השווה מול המומחים האנושיים

בממוצע, השימוש ב-AI כקורא שני הופיע לפחות כשווה לערך לשימוש בשני אנשים, לאחר שנלקחו בחשבון החלטות הבורר. המסלול בסיוע AI הראה יכולת דומה מאוד לאיתור נשים שאכן חלו בסרטן (רגישות) ולהרגעה של מי שלא חלו (ספציפיות), ועונה לקריטריונים סטטיסטיים נוקשים של "לא פחות טוב" (noninferiority). למעשה, הספציפיות היתה מעט גבוהה יותר עם ה-AI, כלומר פחות נשים זומנו ללא צורך, ושיעור גילוי הסרטן היה זהה בפועל בין שתי הגישות. מאחר שה-AI החליף אחת מקריאות האנושיות ברוב המקרים, מספר הקריאות השגרתיות ירד בכמעט חצי, מה שמתרגם להערכת חיסכון בזמן הקוראים של כ-36–44% גם לאחר שהובאו בחשבון המאמצים הנוספים בבורר.

Figure 2
Figure 2.

היכן ה-AI עזר — ואיפה הוא לא עמד בציפיות

לפני הבורר, המערכת של ה-AI הייתה בעלת סבירות גבוהה יותר לעומת קוראים אנושיים בודדים לסמן סרטן שהופיע מאוחר יותר בין סקרים או בסיבוב השגרתי הבא, מה שמרמז שהיא יכולה לעיתים לזהות שינויים עדינים שבני אדם מפספסים. עם זאת, רבות מאותם אזהרות מוקדמות בוטלו במהלך הבורר, במיוחד כאשר הקוראים הושפעו מתמונות ישנות יותר שה-AI לא ניתח או מנקודות מודגשות על ידי ה-AI שהתבררו כחסרות נזק. בתת‑קבוצה קטנה אך חשובה של 93 נשים, ה-AI קבע נכונה שמשהו לא תקין, אך פאנלי הבורר החליטו שלא לזמן לזימון; רוב נשים אלה פיתחו מאוחר יותר סרטן אינטרוול או סרטן בסיבוב הבא. יחד עם זאת, הבורר האנושי ביטל בהצלחה רבות מזימוני ה-AI בנשים שלבסוף היו נקיות מסרטן, ובכך שיפר את הספציפיות הכוללת. על פני קבוצות גיל שונות, רקע אתני, צפיפויות שד וסוגי סרטן שונים, המסלול בסיוע AI בדרך‑כלל השווה לביצועי הטיפול הסטנדרטי, למרות שהתוצאות עבור כמה תת‑קבוצות קטנות היו פחות חד־משמעיות.

מה זה עשוי להגדיר עבור סקרי עתיד

המחקר מציע שה-AI יכול בבטחה למלא את תפקיד הקורא השני בסקר השד מבלי להוריד את איכות הטיפול, תוך הקלה על העומס על כוח אדם מתוח. עם זאת, הוא גם מדגיש את המגבלות של מערכות נוכחיות: כשלעצמו ה-AI הראה פוטנציאל לסמן סרטן מוקדם יותר, אך יתרונות אלה הדחלחו כאשר בני אדם, בצדק זהיר, עברו על חלק מההמלצות של ה-AI. המחברים טוענים כי שיפור האופן שבו ה-AI מסביר את הצעותיו, הפחתת אזעקות שווא מסיחות ועמידה על ההכשרה של קלינאים מתי לסמוך על הכלי ומתי להטיל ספק בו יכולים לשחרר יותר מהפוטנציאל שלו. אם שיתופי פעולה אלה בין אדם למכונה ייעלמו וייבחנו בקפידה בניסויים בעולם האמיתי, סקר בסיוע AI עשוי לא רק לשמר תכניות קיימות אלא גם לסייע לכך שיותר נשים ייתפסו בשלב שבו הטיפול צפוי להצליח ביותר.

ציטוט: Warren, L.M., Venton, J., Young, K.C. et al. Impact of using artificial intelligence as a second reader in breast screening including arbitration. Nat Cancer 7, 507–521 (2026). https://doi.org/10.1038/s43018-026-01128-z

מילות מפתח: סריקה לגילוי סרטן השד, ממוגרפיה, בינה מלאכותית, עומס עבודה ברדיולוגיה, בוררות רפואית