Clear Sky Science · he

למידת פדרציה שומרת-פרטיות עם רשתות CNN משופרות ובעלת מנגנון תשומת-לב קל-משקל לזיהוי ל leukמיה אוטומטי על פני הדמיות רפואיות מבוזרות

2026-02-18 · חזרה לאינדקס

מדוע חשוב לחלוק ידע בלי לחשוף סודות

הרפואה המודרנית מסתמכת יותר ויותר על מחשבים שקוראים תמונות רפואיות, מצילומי רנטגן ועד לפרוסות מיקרוסקופ. אבל אימון מערכות אלו בדרך כלל מחייב איסוף נתונים רגישים של מטופלים במקום מרכזי, מה שמעורר חששות משמעותיים בנוגע לפרטיות. המחקר הזה מראה דרך שבה בתי חולים יכולים לבנות מערכת חזקה לזיהוי לוקמיה מתמונות דם מבלי לשתף את הנתונים הגולמיים של המטופלים, וכך לשלב הגנה על פרטיות עם דיוק אבחוני שקרוב לשורה העליונה.

בתי חולים רבים, מוח משותף אחד

החוקרים מתמקדים בלוקמיה, סוג סרטן של הדם שמאובחן בחלקו על ידי בדיקת תאים תחת מיקרוסקופ. במקום לשלוח תמונות מטופלים לשרת מרכזי, הם משתמשים באסטרטגיה הנקראת למידת פדרציה. בהגדרה זו, מספר בתי חולים שומרים כל אחד את התמונות אצלם ומאמנים עותק של אותו מודל באופן מקומי. מעת לעת נשלחים רק הפרמטרים הנלמדים של המודל לשרת מרכזי מאובטח, שממוצע אותם ושולח חזרה מודל משופר משותף. כך מקובץ הידע מבלי שהתמונות הבסיסיות יוצאות מהמוסד המארח.

להכין רשת קטנה שתשים לב לפרטים

בלב המסגרת עומד מודל קל-משקל לניתוח תמונות המבוסס על רשתות נוירונים קונבולוציוניות, כלי סטנדרטי לניתוח תמונות. המחברים משדרגים אותו במנגנון תשומת-לב קומפקטי שעוזר לרשת להתמקד בחלקים המידע־רלוונטיים ביותר של כל תא דם, כגון צורת הגרעין ומרקם החומר הסובב. אף על פי שלמודל יש רק כ־33,000 פרמטרים ניתנים לכיול — חלק מזערי בהשוואה לרשתות מודרניות רבות — הוא עדיין מסוגל להבדיל בין ארבע קטגוריות קליניות חשובות: תאים שפירים, שינויים מוקדמים, מצבים פרה־לוקמיים ותאים פרו־לוקמיים מפותחים. עיצוב קפדני שומר על מהירות חישוב מספקת לשימוש מעשי במעבדות שגרתיות.

למידה הוגנת מתוך נתונים מפוזרים ולא מאוזנים

במערכות בריאות אמיתיות, בתי החולים אינם רואים את אותו תמהיל של מטופלים. מרכז אחד עשוי לקבל בעיקר מקרים בשלבים מוקדמים, ואחר רואים יותר מקרים מתקדמים. הצוות משקף בכוונה חוסר שוויון זה על ידי פיצול מערך נתונים של 3,256 תמונות מטוש דם על פני מספר בתי חולים מדומים עם אחוזים משתנים של כל שלב של הלוקמיה. הם מנתחים כיצד התפלגות לא-אחידה זו משפיעה על הלמידה, תוך שימוש במדדים סטטיסטיים כדי לכמת עד כמה נתוני כל בית חולים שונים וכמה דומות הדיוקים הסופיים שלהם. סכימת ממוצע משוקללת מבטיחה שלאתרים עם יותר נתונים יש השפעה פרופורציונלית ועדיין שומרת על הבדלים בביצועים בין אתרים קטנים מאוד.

דיוק שמתחרה באימון מרכזי

לאחר שהנתונים נותרו מפוזרים ובעלי התפלגות לא אחידה, המודל המשותף לומד עדיין לסווג את שלבי הלוקמיה ברמה מרשימה. עם שלושה בתי חולים מדומים, המודל הגלובלי מגיע לכ־95.7% דיוק על תמונות מבחן שמורות; עם חמישה בתי חולים וסבבי אימון נוספים הדיוק עולה לכ־96.6% בקירוב. קטגוריות ממאירות — אלו המייצגות מצבים פרה־לוקמיים ומתקדמים יותר — מזוהות היטב במיוחד, עם ציונים קרובים למושלם במקרים מסוימים. הקטגוריה המאתגרת יותר של תאים שפירים, שהיא גם מיוצגת פחות, מציגה ביצועים מעט נמוכים יותר, מה שמדגיש את הצורך באיזון טוב יותר או בטכניקות ממוקדות לכיתות נדירות אך חשובות. עם זאת, המערכת הפדרטיבית מתקרבת לשבריר מהדיוק שהושג כאשר כל הנתונים מרוכזים, וזאת תוך שמירה על יתרונות הפרטיות של אחסון מקומי.

להפוך את תהליך ההחלטה של המחשב לגלוי ואמין

כדי לבנות אמון בקרב קלינאים, המחברים חורגים מעבר לדיוק גולמי ובוחנים כיצד המודל מקבל את החלטותיו. הם מייצרים שכבות חזותיות שמדגישות אילו חלקים בתמונת כל תא השפיעו ביותר על התוצאה. המפות האלו מגלות שהמודל מתרכז בתכונות רפואיות משמעותיות, כגון צורות גרעין חריגות בשלבים המסוכנים יותר של הלוקמיה, ומציג דפוסים מפוזרים יותר עבור תאים שפירים. הצוות גם בוחן את מידת הבטחון של המודל בתחזיותיו ומקבל שמענה נכונים נוטים להיות בעלי ביטחון גבוה, במיוחד עבור שלבים ממאירים, דבר המצביע על התאמה טובה בין ביטחון המערכת לאמינותה.

מה משמעות הדבר לאבחון סרטן בעתיד

לא-מומחים, המסר המרכזי הוא שעכשיו ניתן לבתי חולים לשתף פעולה על אבחון סרטן חכם יותר מבלי למסור את תמונות המטופלים שלהם. עבודה זו מדגימה שמודל קומפקטי ומתוכנן בקפידה המאמץ דרך למידת פדרציה יכול להתקרב לדיוק של שיטות שמרכזות נתונים, תוך כיבוד כללי פרטיות ומגבלות מעשיות של כוח חישוב ותעבורת רשת. עם עבודה נוספת לשיפור טיפול בסוגי תאים מיוצגים פחות ולהפחתת עלויות התקשורת, מערכות שמורות-פרטיות דומות יכולות להתרחב לסוגי סרטן ובדיקות הדמיה אחרות, ולעזור לקלינאים ברחבי העולם להנות מניסיון משותף מבלי לחשוף מטופלים בודדים.

ציטוט: Awan, M.Z., Khan, N.A., Strakos, P. et al. Privacy-preserving federated learning with light-weight attention improved CNNs for automated leukemia detection across distributed medical imaging. Sci Rep 16, 9768 (2026). https://doi.org/10.1038/s41598-026-40581-9

מילות מפתח: למידת פדרציה, הדמיית לוקמיה, פרטיות בבינה רפואית, CNN מבוסס תשומת-לב, פתולוגיה דיגיטלית