Clear Sky Science · he
מסגרת פרטיות סטוכסטית עם הטמעת פויסון ללמידה פדרטיבית והצפנה הומומורפית מאובטחת בבינה מלאכותית רפואית
שמירה על סודות רפואיים בזמן שאנו מלמדים מכונות
בתי חולים אוספים כמויות אדירות של תמונות רנטגן שיכולות לעזור לרופאים לזהות מחלות כמו COVID‑19 מוקדם ובדיוק רב יותר. עם זאת, התמונות האלה גם אינן פרטיות וכללי פרטיות נוקשים מקשים על איחוד הנתונים במקום מרכזי כדי לאמן כלים חזקים של בינה מלאכותית. המחקר הזה מציג דרך לאפשר לבתי חולים לשתף פעולה במערכת אבחון רנטגן משותפת מבלי למסור את התמונות הגולמיות לאף גורם אחר, במטרה לשמור על נתוני המטופלים מאובטחים ועדיין להשיג דיוק ברמה גבוהה.

מדוע שיתוף נתונים רפואיים כל כך קשה
הבינה המלאכותית המודרנית שואבת כוח ממאגרי נתונים גדולים ומגוונים, אך בתי חולים בדרך כלל שומרים תמונות באופן מקומי והם מהססים—או אסורים מצד החוק—לשלוח אותן לשרת מרכזי. שיטות מסורתיות שמעותקות את כל הנתונים למסד נתונים מרכזי מחדירות סיכוני דליפה והתקפות סייבר, מה שפוגע באמון הציבור ומפר תקנות. אפילו שיטות חדשות יותר, שבהן בתי החולים מאמנים מודל משותף יחד במסגרת שנקראת “למידה פדרטיבית”, אינן בטוחות לחלוטין: תוקפים מתוחכמים לעתים יכולים לעבוד לאחור מתוך עדכוני המודל כדי לנחש איך נראו תמונות של מטופלים. במקביל, נתונים רפואיים לעתים קרובות לא אחידים ומבולגנים, כאשר לחלק מבתי החולים יש הרבה יותר מקרים של מחלה מסוימת מאחרים, מה שעלול לערער את תהליך האימון ולהפחית את האמינות.
רשת שיתופית שאינה משתפת רנטגנים גולמיים
המחברים מפתחים מסגרת למידה פדרטיבית המבוססת על מודל זיהוי תמונה חזק הידוע כ‑ResNet‑50 כדי להבחין בין COVID‑19 לרנטגן חזה נורמלי. כל בית חולים מאמן עותק מקומי של המודל הזה על תמונותיו המקומיות, ושומר את כל תמונות הרנטגן באתרו. במקום לשלוח תמונות, בתי החולים שולחים רק עדכונים מספריים המתארים כיצד יש לשנות את המודל המקומי שלהם. שרת מרכזי ממוצע את העדכונים הללו כדי ליצור מודל עולמי משופר ואז שולח את המודל המעודכן חזרה לכל בית חולים. חזרה על מחזור זה מאפשרת למודל המשותף להרוויח מהניסיון המשולב של כל המשתתפים מבלי לחשוף סריקות יחידניות.
הוספת "רעשים" דיגיטליים ותיבות נעילה לפרטיות נוספת
כדי למנוע מתוקפים לשחזר תמונות מטופלים מתוך עדכוני המודל, המסגרת משלבת שתי טכניקות פרטיות מעל הלמידה הפדרטיבית. ראשית, כל בית חולים מוסיף רעש אקראי מכויל בקפידה לעדכוני המודל שלו, בדומה להוספת סטאטיקה לאות רדיו כך שקולות בודדים קשה יותר לזהות בעוד שהמסר הכולל עדיין עובר. שנית, לפני שהעדכונים נעים ברשת, הם מוצפנים באמצעות שיטה שמאפשרת לשרת לסכום אותם בעוד הם נשארים נעולים—בדומה לחישוב סכום בתוך מעטפות סגורות. רק מחזיק מפתח מהימן יכול לפתוח את התוצאה המשולבת, והשרת המרכזי לעולם אינו רואה את העדכון של בית החולים בפורמט קריא. יחד, צעדים אלה מיועדים להקשות על ניסיונות לבצע הנדסה לאחור של נתוני מטופלים תוך שמירה על תועלת המודל המשותף.

מבחן המערכת
הצוות מעריך את המסגרת שלהם על סט מאוזן של תמונות רנטגן חזה של COVID‑19 ונורמליות, בסימולציה של מספר בתי חולים כאתרי אימון נפרדים. הם משווים שלושה סידורי פעולה: אימון מרוכז קלאסי עם כל הנתונים מאוחדים, למידה פדרטיבית סטנדרטית ללא הגנות נוספות, והגישה המוגנת שלהם. למרות הרעש וההצפנה הנוספים, המערכת המוגנת משיגה דיוקים גבוהים באופן מרשים—בערך 99.6% דיוק, עם ערכי דיוק, זיכרון ו‑F1 חזקים בדומה—התואמים או משתפרים על הגרסאות המאוחדות והלא מוגנות. מדידות של סבבי תקשורת, איבוד אימון וזמן חישוב מראות שהדיוק משתפר בעקביות ככל שהאתרים משתפים פעולה, בעוד עלות הזמן הנוספת מההצפנה נשארת מתונה. ניסויי אבחנה, שבהם חלקים מהמערכת מדומים כבמנוחה או מכובה, מאשרים שהרמות הנבחרות של רעש ואסטרטגיית הצפנה‑בעד צמצום מציעות פרטיות חזקה עם רק ויתור ביצועים מינימלי.
מה משמעות הדבר לטיפול בעתיד
לאנשים שאינם מומחים, המסר המרכזי הוא שעבודה זו מדגימה מתכון מעשי ללימוד בינה מלאכותית מתוך רנטגנים של בתי חולים רבים מבלי לחשוף לעולם תמונות גולמיות או להחליש חוקים לשמירת פרטיות. בשילוב מודל תמונה בעל ביצועים גבוהים עם "סטאטיקה" דיגיטלית ואגרגציה מוצפנת, המסגרת מראה שבתי חולים יכולים לבנות כלי אבחון מדויקים במשותף תוך שמירה על הנתונים של המטופלים באתר ועל מרחק מפני עיניים סקרניות. למרות שנבדק על מאגר נתונים יחסית קטן והתמקד ברנטגנים של COVID‑19, הרעיונות הללו עלולים להתרחב למחלות אחרות, סוגי הדמיה נוספים ואפילו לתחומים רגישים אחרים כמו פיננסים. בקצרה, המחקר מצביע על עתיד שבו בינה מלאכותית חזקה ופרטיות רפואית איתנה יכולים להחליף זו את זו ולהתחזק במשותף.
ציטוט: Gomathi, R., Saranya, K., Mahaboob John, Y.M. et al. Stochastic Poisson-embedded privacy framework for federated learning with secure homomorphic encryption in medical AI. Sci Rep 16, 10931 (2026). https://doi.org/10.1038/s41598-026-41469-4
מילות מפתח: למידה פדרטיבית, הדמיה רפואית, פרטיות נתונים, הצפנה הומומורפית, אבחון באמצעות צילום רנטגן