Clear Sky Science · he
ביצועי תת‑קבוצה של מודל מסחרי לדיוק דיגיטלי תומוגרפי לשד לזיהוי סרטן השד
מדוע זה חשוב לנשים ולמשפחות
סקרינג לסרטן השד מציל חיים, אך אף מבחן אינו מושלם. רופאים פונים כעת לבינה מלאכותית (AI) כדי לסייע בקריאת צילומי רנטגן תלת‑ממדיים של השד. מחקר זה בחן בעין מתמקדת כיצד מערכת AI נפוצה מתנהגת עבור קבוצות שונות של נשים וסוגים שונים של שינויים בשד, וחשף היכן הכלי עובד היטב והיכן הוא מתקשה. 
מבט מעמיק על סוג חדש של ממוגרפיה
ממוגרפיות מסורתיות הן צילומי רנטגן שטוחים דו‑ממדיים. רבים מהמרפאות משתמשות כיום בתומוגרפיה דיגיטלית של השד (DBT), סריקה דמוית‑תלת‑ממד הבנויה מהרבה פרוסות דקות של השד. היא יכולה לגלות סרטן שעלול להסתתר ברקמות חופפות, במיוחד בשד צפוף, אך קריאת התמונות אורכת זמן רב יותר והן עדיין עלולות לפספס נקודות קלציפיות זעירות שמסמנות מחלה מוקדמת. לכן חברות פיתחו כלים מבוססי AI לסימון אזורים חשודים עבור הרדיולוגים. עד כה, רוב הערכות הכלים הללו התמקדו בדיוק הכולל, לא בהתנהגות עבור מטופלות או סוגי גידול ספציפיים.
מבחן עצום מהעולם האמיתי של עוזר AI
חוקרים מאוניברסיטת אמרי בחנו מערכת מסחרית של AI בשם INSIGHT DBT, שהופעלה על תמונות שד תלת‑ממדיות מתוך יותר מ‑167,000 בדיקות סקרינג ב‑61,000 נשים ומעלה. הם השוו ציוני AI עם תוצאות בפועל, והפרידו בין בדיקות שנחשבו בבירור שליליות, ביופסיות שפיריות, וגידולים מאומתים. השאלה המרכזית הייתה עד כמה ה‑AI מבחין בין סרטן שנמצא במהלך סקר רגיל ובין בדיקות שלא היו סרטן. על כלל האוכלוסייה, ה‑AI הראה ביצועים חזקים, דירג נכון רוב הבדיקות הסרטניות והלא‑סרטניות והתאים לתוצאות הסקירה הרגולטורית המקורית שלו. הביצוע היה דומה לפי גיל, גזע וקבוצות אתניות — ממצא חשוב לשוויון בטיפול.
היכן ה‑AI זוהר והיכן הוא מתקשה
כאשר הצוות ניתח בפירוט, עלו דפוסים מרכזיים. ה‑AI היה הטוב ביותר בזיהוי גידולים פולשים היוצרים גושים מוצקים או גורמים לעיוותים נראים ברקמת השד; הוא סימן נכון את רוב המקרים האלה. הוא היה פחות אמין עבור גידולים הנמצאים בתוך צינורות החלב, הידועים כמחלה in situ, וגם עבור גידולים המופיעים בעיקר כאשכולות דקות של משקעים קלציפיים. עבור נגעים מוקדמים אלה, המערכת החמיצה כמעט חצי מהמקרים, ודיוקה הכולל ירד. רקמת שד צפופה גם הורידה במידה מתונה את הביצועים, ככל הנראה כי רקמה צפופה יכולה להסתיר סימנים עדינים. 
מה חושפים דפוסי הציונים
על‑ידי בדיקה של טווח הציונים המלא של ה‑AI במקום לקריאות כן/לא בלבד, החוקרים ראו שמבדקי עם פתולוגיה מעוררת דאגה קיבלו נטייה לציונים גבוהים יותר. ממצאים שפירים ובעלי סיכון נמוך בדרך כלל קיבלו ציונים נמוכים, בעוד שגידולים פולשניים התרכזו בקצה הגבוה. עם זאת, כמה עיוותים לא סרטניים קיבלו ציונים גבוהים והובילו לאותות שווא, וכמה תת‑סוגים נדירים של גידולים פולשניים ושל נגעי in situ קוטלגו בציונים נמוכים מדי. ה‑AI אף נתן ציונים גבוהים לכ‑שליש מהגידולים שהופיעו בין בדיקות סקר רגילות, מה שמרמז שלפעמים הוא מזהה רמזים שבני אדם מפספסים, אם כי ההשפעה במציאות אינה ודאית.
השלכות עבור מטופלות והרופאים
לקורא שאינו מקצועי, המסקנה היא שכלי ה‑AI הזה יכול לסייע במידה משמעותית לרדיולוגים בקריאת תמונות שד תלת‑ממדיות מורכבות, ללא הבדלים ברורים בין קבוצות דמוגרפיות עיקריות. עם זאת, הוא אינו גלאי סרטנים עצמאי. הוא פחות מהימן עבור סרטן מוקדם מבוסס‑קלציפיקציות ובשדיים צפופים מאוד, ועדיין יכול לגרום למעקב מיותר במקרים שפירים. המחברים טוענים כי הבנת נקודות החוזק והעוורות הללו חיונית לפני להסתמך על AI בסקרינג היומיומי, כדי שרופאים ישתמשו בו כשותף זהיר ולא כתחליף.
ציטוט: Brown-Mulry, B., Isaac, R.S., Lee, S.H. et al. Subgroup performance of a commercial digital breast tomosynthesis model for breast cancer detection. Nat Commun 17, 4249 (2026). https://doi.org/10.1038/s41467-026-70637-3
מילות מפתח: בדיקות סקרינג לסרטן השד, תומוגרפיה דיגיטלית של השד, בינה מלאכותית רפואית, ממוגרפיה, DCIS