Clear Sky Science · he

סגמנטציה של תסמונת טרומבוס ורידי עמוק עם שמירה על פרטיות באמצעות מסגרת למידה פדרטיבית מרובת‑מודלים ואלגוריתם ממוצע פדרטיבי

· חזרה לאינדקס

מדוע קרישי דם ופרטיות נתונים חשובים

קרישי דם הנוצרים בעומק ורידי הרגליים, הידועים כתסחיף ורידי עמוק (DVT), עלולים לנוע בשקט אל הריאות ולגרום למצבי חירום מסכני חיים. סריקות CT יכולות לחשוף קרישים אלה, אך הפיכת אלפי תמונות בגווני אפור לזיהויים אוטומטיים מהימנים היא משימה קשה למחשבים. במקביל, בתי חולים זהירים בצדק לגבי שיתוף נתוני מטופלים רגישים. מחקר זה חוקר כיצד מספר בתי חולים יכולים לשתף פעולה לאימון מערכת בינה מלאכותית חזקה לזיהוי קרישי דם—מבלי לאחד או לחשוף מעולם את תמונות המטופלים הגולמיות שלהם.

לשתף מוח, לא גוף

הליבה של העבודה היא טכניקה הנקראת למידה פדרטיבית, המאפשרת למוסדות לשתף פעולה באימון מודלים של בינה מלאכותית תוך שמירה על הנתונים באתר. במקום לשלוח תמונות CT לשרת מרכזי, כל בית חולים מאמן מודל מקומי על הסריקות שלו. רק הפרמטרים של המודל—בעצם מה שהוא "למד" על זיהוי קרישים—נשלחים לשרת מרכזי. שם, גישה הנקראת ממוצע פדרטיבי משלבת את מערכי הפרמטרים השונים הללו למודל גלובלי משופר אחד, שמוחזר לאחר מכן לכל בתי החולים. בדרך זו כל אתר נהנה מניסיון הקולקטיב של כל המשתתפים, בעוד שאף תמונה של מטופל אינה עוזבת את המוסד שלה.

Figure 1
Figure 1.

סגנונות רבים של בינה מלאכותית מביטים באותם ורידים

חדשנות מרכזית במחקר זה היא שהחוקרים לא הסתמכו על סוג יחיד של רשת עצבית. הם הרכיבו שבעה עיצובים מודליים שונים, שכל אחד מהם טוב בזיהוי היבטים שונים של תמונות ה‑CT. מודלים פשוטים יותר, כגון רשתות קונבולוציה בסיסיות ומודלים סידתיים, מהירים וקלים יותר להפעלה על חומרה מוגבלת. ארכיטקטורות מתקדמות יותר, כולל U‑Net, VGG‑19 ושני רשתות מותאמות אישית עם בלוקים של רזידואל, אינספשן, תשומת לב ועיבוד רב‑קנייני, טובות יותר במעקב אחר גבולות כלי דם עדינים, בזיהוי קרישים קטנים ובהתמודדות עם תמונות רועשות. על ידי כך שכל בית חולים יכול להשתמש במודל המתאים ביותר לנתוניו ולכוח המחשוב שלו, המערכת משקפת את המציאות המסורבלת של סביבות קליניות בעולם האמיתי במקום להניח שכולם דומים.

ללמוד מנתונים לא שווים ולא מושלמים

ברפואה, נתונים מבית חולים אחד נדירים זהים לחלוטין לנתונים מבית חולים אחר. סורקים, פרוטוקולי הדמיה ואוכלוסיות מטופלים שונים, ולכן המחקר עבד בדוֹקָתּוּת עם נתונים "לא‑IID"—אוספים לא אחידים ואינם מופצים בצורה זהה. זה בדרך כלל הופך את האימון לבלתי יציב יותר. כאן המחברים אימצו את המגוון הזה והראו שאיחוד הידע בין מספר מודלים בעלי מבנים שונים שיפר בפועל את יכולת ההכללה של המערכת הגלובלית. הם ערכו שלוש שלבי ניסוי: תחילה עם שלושה לקוחות, אחר כך חמש ולבסוף שבע, תוך שימוש בערכות נתונים של 1,000, 2,000 ו‑3,000 תמונות CT. בכל שלב הם עקבו לא רק אחרי תדירות הסגמנטציה הנכונה של הקרישים על ידי המודל הגלובלי, אלא גם כמה תקשורת נדרשה, כמה זמן האימון ארך, עד כמה נתוני כל לקוח שונים וכמה טוב אמצעי ההגנה על הפרטיות עמדו במבחן.

זיהוי קרישים מדויק יותר, במחיר חישובי

בכל השלבים המודל הגלובלי המשולב עקף בעקביות כל מודל מקומי בודד. ככל שמספר התמונות גדל ויותר מודלים מתוחכמים הצטרפו לפדרציה, דיוק הסגמנטציה עלה מכ־91% לכמעלה מ־96%, ומדד איכות מאוזן שנקרא F1‑score טיפס מכ־0.89 לכ־0.95. במקביל, מדד אובדן ממוקד שגיאות ירד ביותר ממחצית, מה שמעיד על קווי מתאר של קרישים נקיים ומהימנים יותר. הישגים אלו לא הגיעו בחינם: התקשורת בין הלקוחות לשרת גדלה מעשרות מגהבייטים לכמה גיגאבייטים, וזמני האימון הממוצעים עלו משניות לשעות רבות כשארכיטקטורת המערכת התרחבה. למרות זאת, המערכת שמרה על ערבות פרטיות פורמלית חזקה, שמעידה שהעדכונים המשותפים מדליפים מעט מאוד מידע על כל מטופל יחיד.

Figure 2
Figure 2.

מה זה אומר עבור מטופלים ובתי חולים

בעיני אדם מן השורה, המסר הוא שעבודה זו מראה כיצד בתי חולים יכולים ללמד בינה משותפת לזהות קרישי דם מסוכנים בצורה מדויקת יותר, מבלי לוותר על השליטה בנתוניהם הרגישים. על ידי שילוב מספר עיצובים מודליים משלימים ואגרגציה זהירה של מה שכל אחד מהם לומד, המחברים בונים מערכת סגמנטציה לקרישים שהיא גם חזקה וגם מכבדת פרטיות. אף על פי שהגישה דורשת משאבי חישוב ורוחב פס ניכרים, היא מצביעה על עתיד שבו מרכזים רפואיים משתפים פעולה שגרתית על כלי אבחון חכמים יותר, משפרים את הטיפול בחולים בסיכון ל‑DVT ומצבים קשורים תוך שמירה על סריקותיהם האישיות מאחורי חומות המוסדות שלהם.

ציטוט: B, P.L., S, V. Privacy-aware deep vein thrombosis segmentation using a multi-model federated learning framework with the federated averaging algorithm. Sci Rep 16, 11333 (2026). https://doi.org/10.1038/s41598-026-36432-2

מילות מפתח: תסחיף ורידי עמוק, למידה פדרטיבית, סגמנטציה של תמונות רפואיות, בינה מלאכותית שומרת פרטיות, הדמיית CT