Clear Sky Science · he

איזון בין הוגנות וביצועים בחיזוי דרגת גליותמה באמצעות שיטות להפחתת הטיה

· חזרה לאינדקס

מדוע חשוב לטפל בגידולים באופן הוגן

כאשר רופאים משתמשים בבינה מלאכותית כדי לסייע באבחון גידולים במוח, עשוי להיראות שהמחשב ניטרלי. אך אם הנתונים ששימשו לאימון הכלים משקפים אי־שוויון בריאותי קיים, התוכנה עלולה לטפל בחולים מסוימים באופן פחות הוגן. מחקר זה בוחן כיצד מערכות למידה חישובית החוזות את חומרת הגליותמות — סוג נפוץ של גידול מוח בקרב מבוגרים — עלולות באופן בלתי מכוון להעדיף קבוצות גזעיות או מגדריות מסוימות, ובודק דרכים מעשיות לגרום לחיזויים אלה להיות הוגנים יותר מבלי להקריב יותר מדי מהדיוק.

Figure 1
Figure 1.

גידולי מוח ועוזרים ממוחשבים

גליותמות הן גידולי מוח הנעים מצורות איטיות יותר וברת־טיפול ועד לסרטן אגרסיבי מאוד עם הישרדות נמוכה. דירוג נכון של הגידולים חיוני, מכיוון שהוא מכוון את הניתוח, הקרינה והטיפול התרופתי. החוקרים עבדו עם מאגר נתונים ציבורי של 839 מבוגרים שסווגו כגליותמה בדרגה נמוכה או כגליובלסטומה אגרסיבית. עבור כל חולה נרשמו גיל, מגדר, גזע ו־20 סמנים גנטיים נפוצים בגידול. הם אימנו שלושה מודלים סטנדרטיים — רגרסיה לוגיסטית, יער אקראי ועיבוד בעזרת הגברה גרדיאנטית — כדי להבחין בין שתי דרגות הגידול באמצעות התכונות הללו, ולאחר מכן בדקו הן את הדיוק הכללי של המודלים והן את אופן הטיפול בקבוצות חולים שונות.

מחפשים חוסר איזון סמוי

כדי לבחון הוגנות, הצוות התרכז בשני מאפיינים "מוגנים": גזע (לבנים לעומת לא־לבנים) ומגדר (גברים לעומת נשים). מאגר הנתונים עצמו היה מעוות — למעלה מ־90 אחוז מהחולים היו לבנים, והיו יותר גברים מאשר נשים. המחברים השתמשו במדדי הוגנות ברמת קבוצה המשווים כמה לעתים קבוצות שונות מקבלות חיזוי "דרגה גבוהה" נכון וכמה טעויות המודל מבצע עבור כל קבוצה. כל שלושת המודלים היו די מדויקים בסך הכל, כאשר הרגרסיה הלוגיסטית הניבה את הביצועים הטובים ביותר. אך מתחת להצלחה הזו, בדיקות ההוגנות חשפו שחולים לא־לבנים בדרך כלל קיבלו תוצאות גרועות יותר מאשר חולים לבנים, במיוחד בזיהוי נכון של הגידולים הפחות אגרסיביים. לעומת זאת, הביצועים בין גברים ונשים היו מאוזנים הרבה יותר, עם הבדלים קטנים בלבד בין המגדרים.

מנסים לתקן את ההטיה

החוקרים שאלו האם אפשר לשפר את ההוגנות מבלי לפגוע משמעותית בתועלת הרפואית של המודל. הם בחרו ברגרסיה לוגיסטית כמודל בסיס, מאחר שהיא הייתה הן המדויקת ביותר והן ההוגנת ביותר מבין השלושה. הם ניסו שתי אסטרטגיות שכיחות להפחתת הטיה. גישה של "קדם־עיבוד" שנקראת reweighting נתנה חשיבות נוספת לחולים תת־מייצגים במהלך האימון, כך שהמודל ישים עליהם יותר דגש. גישה של "לאחר עיבוד" שנקראת equalized odds שמרה על המודל המאומן אך התאימה את התוצאות שלו כך ששיעורי השגיאה יהפכו דומים יותר בין הקבוצות.

Figure 2
Figure 2.

מה השתנה כשכיוונו את המודל

לגבי מגדר, שתי האסטרטגיות עזרו בדרך כלל: איכות החיזוי לנשים השתפרה וההבדלים בין גברים לנשים הצטמצמו במידה ניכרת. לגבי גזע, שבו חוסר האיזון בנתונים היה חזק בהרבה, התמונה הייתה מסובכת יותר. reweighting לעיתים דווקא פגע, והחמיר במעט את הביצועים עבור חולים לא־לבנים ואף הגדיל אי־הוגנות לפי מדדים מסוימים. לעומת זאת, שיטת ה־post‑processing צמצמה משמעותית את הפערים הגזעיים בשיעורי השגיאה תוך שמירה על דיוק כולל גבוה של המודל, אם כי היא הורידה במעט את הביצועים עבור קבוצת הרוב. המחברים גם הראו שמדדי ההוגנות עבור קבוצת הלא־לבנים, שהיא קטנה הרבה יותר, אינם יציבים סטטיסטית — שינוי בחיזוי של אדם אחד בלבד יכול להזיז במידה ניכרת את ציוני ההוגנות — ולכן יש לפרש תוצאות אלה בזהירות.

מה המשמעות עבור חולים ורופאים

המסקנה של המחקר היא שאין ארוחה חינם: שיפור ההוגנות בבינה רפואית לעיתים כרוך ויתורים בביצועים, והפתרון הטוב ביותר תלוי במידת העיוות בנתונים ובמטרה ההוגנות שנבחרה. בדוגמה של גידול מוח זו, כוונון התוצאות לאחר האימון היה הדרך הפרקטית ביותר להפוך המלצות טיפול לשוויוניות יותר על פני גזע ומגדר, תוך שמירה על כוח חיזוי חזק. העבודה מדגישה שיש לבצע בדיקות הוגנות כשפועלים לפרוס בינה מלאכותית במערכת הבריאות, בפרט למצבים רציניים כמו גליותמה, ושיש שיטות כדי להפוך את הכלים הללו להוגנים יותר — אך יש לבחור ולפרש שיטות אלה בזהירות.

ציטוט: Sánchez-Marqués, R., García, V. & Sánchez, J.S. Addressing the balance between fairness and performance in glioma grade prediction using bias mitigation techniques. Sci Rep 16, 9785 (2026). https://doi.org/10.1038/s41598-026-40555-x

מילות מפתח: דירוג גליותמה, הוגנות בבינה רפואית, הטיה אלגוריתמית, גידולים במוח, הפחתת הטיה