Clear Sky Science · he
UNet מקבילי המשלב KAN ו‑mamba לחלוקת תמונות רפואיות
מדוע זה חשוב למטופלים ולרופאים
מאחורי כל סריקת סקרן לסרטן או תמונת אולטרסונוגרפיה עומד שלב קריטי של למידת מחשבים להסרת קווים היכן נמצאת באמת הנגע או האיבר. תהליך זה, שנקרא סגמנטציה, עוזר לרופאים למדוד גידולים, לעקוב אחר המחלה ולתכנן טיפול. המאמר מציג את KMP‑UNet, סוג חדש של רשת ניתוח תמונה קומפקטית המבטיחה לעקוב אחרי גבולות אלה בדיוק וביעילות גבוהים יותר, ובכך עשויה להפוך את קריאת התמונות הרפואיות האוטומטית לאמינה וקלה יותר לפריסה במרפאות אמיתיות.

לראות את התמונה המלאה בסריקה רפואית
תמונות רפואיות מודרניות הן גדולות ומורכבות: רמזים חשובים יכולים להתפרש על פני שטח רחב, בעוד שלנגע עצמו עשויים להיות גבולות מטושטשים או לא רגולריים. רשתות קונבולוציה מסורתיות, כולל משפחת UNet הפופולרית, טובות בזיהוי דפוסים מקומיים אך מתקשות לקשר אזורים מרוחקים בסריקה. מודלים מבוססי Transformer יכולים לראות את כל התמונה בבת אחת אך נוטים להיות כבדים ואיטיים, מה שמהווה בעיה עבור נתוני קליניקה ברזולוציה גבוהה וחומרה מוגבלת בבתי חולים. המחברים בונים על משפחה חדשה של מודלים לסדרות, שנקראת דגמי מרחב‑מצבים, ועל סגנון רשת חדש המכונה רשתות קולמוגורוב–ארנולד, כדי ללכוד גם הקשר רחב וגם פרטים עדינים מבלי לגרום להתנפחות חישובית.
שני מומחים חכמים העובדים זה לצד זה
KMP‑UNet שומרת על פריסת המקודד‑דקודר בצורת U המוכרת של UNet אך משנה את מה שקורה בפנים. במקום להסתמך על סוג אחד של עיבוד בלבד, היא מפעילה שתי זרועות מקבילות לאורך הרשת. זרוע אחת מבוססת על מודל בשם Mamba, שמתמחה בטיפול בסדרות ארוכות ומותאם כאן לסרוק לאורך התמונה. זרוע זו אוספת ביעילות הקשר לטווחים ארוכים, ועוזרת לרשת להבין כיצד אזורים מרוחקים קשורים זה לזה. הזרוע השנייה משתמשת ברשתות קולמוגורוב–ארנולד, שמחליפות פונקציות אקטיבציה קבועות בעקומות גמישות שניתנות ללמידה. זה נותן למודל כוח נוסף לייצג תבניות לא‑ליניאריות מסובכות, כמו שינויים עדינים בעוצמת האור לאורך שפת נגע עור או פוליפ.
מיזוג חכם של תכונות וגבולות ברורים יותר
חיבור פשוט של סוגי מודלים שונים אינו מספיק; האתגר האמיתי הוא האופן שבו משלבים את החוזקות שלהם. לצורך כך, המחברים מציגים את בלוק Parallel Convolution Mamba (PCMB), שמפצל את התכונות לקבוצות ומעבד אותן דרך מספר נתיבים קלים מבוססי Mamba וקונבולוציה לפני מיזוגן חזרה יחד. עיצוב זה מאזֵן בין הקשר גלובלי לפרטים עדינים תוך שמירה על עלות חישובית נמוכה. הם גם מבצעים בחינה מחודשת של חיבורי ה‑skip המקשרים בין המקודד לדקודר. מודול חדש של תשומת לב מרחבית‑ערוצית משודרגת (ESCA) מדגיש באופן סלקטיבי מיקומים וערוצי תכונה חשובים, תוך שמירה על מידע שימושי בעזרת חיבורים שאריתיים. זה מקטין את הסיכון שהרשת תתבלבל על ידי הסחות כמו שיער, ברק או מרקמים רועשים סביב הנגע.

עד כמה הגישה החדשה עובדת?
הצוות מעריך את KMP‑UNet על ארבעה מאגרי נתונים ציבוריים המכסים נגעי עור, פוליפים בקולון ותמונות אולטרסונוגרפיה של השד, ובנוסף בודק העברה למאגר עור נוסף. לאורך הבנצמרקים הללו, המודל מתאים או עולה על מגוון בסיסים חזקים, כולל וריאנטים קלאסיים של UNet, עיצובים מבוססי Transformer ורשתות עדכניות משופרות ב‑Mamba ו‑KAN. לדוגמה, על מאגר נפוץ של נגעי עור (ISIC2018), KMP‑UNet משיגה ציון Dice ודיוק גבוהים תוך שימוש בכמיליון פרמטרים לערך—הרבה פחות מאשר מתחרים רבים. ניסויים מפורטים מראים שכל רכיב—דגימת הקשר מבוססת Mamba, שיפור הלא‑ליניאריות מבוסס KAN ושיפור ה‑skip מבוסס ESCA—תורם רווחים מדידים, במיוחד באיכות הגבול ובהפחתת אזורים חיוביים שגויים.
מה משמעות הדבר לכלי בינה מלאכותית רפואיים בעתיד
ללא‑מומחים, המסקנה המרכזית היא ש‑KMP‑UNet מציעה דרך קומפקטית ובעלת יכולת גבוהה יותר ללמד מחשבים לסמן נגעים ואיברים בתמונות, בכך שהיא מאפשרת לשני "מומחים" משלימים לעבוד במקביל ואז למזג בקפידה את תובנותיהם. בעוד שהשיטה עדיין מתקשה במקרים המאתגרים ביותר—צורות מאוד לא רגולריות, גבולות מטושטשים מאוד או ארטיפקטים כבדים—היא מספקת בסיס חזק לסגמנטציה מדויקת ויעילה. בעבודה נוספת על טיפול ברקעים רועשים והסתגלות בין מרכזי הדמיה, גישות כמו KMP‑UNet יכולות לעזור לקרב ניתוח תמונות מהימן ומהיר אל הפרקטיקה הקלינית היומיומית.
ציטוט: Liu, J., Wu, J., Xu, L. et al. A parallel UNet integrating KAN and mamba for medical image segmentation. Sci Rep 16, 13579 (2026). https://doi.org/10.1038/s41598-026-43127-1
מילות מפתח: חלוקת תמונות רפואיות, למידה עמוקה, UNet, דגמי מרחב-מצבים, רשתות קולמוגורוב–ארנולד