Clear Sky Science · he

Efficient SqueezeViT: מסגרת Transformer חזותי קומפקטית לסיווג תמונות צילומי חזה

· חזרה לאינדקס

מדוע קריאה מהירה של צילומי חזה חשובה

צילומי חזה הם אחת השיטות הנפוצות ביותר לרופאים לחפש בעיות בריאותיות בריאות ובלב, החל מדלקת ריאות ועד שחפת. בבתי חולים עמוסים או במרפאות קטנות עם יכולות חישוב מוגבלות, קשה להפעיל כלים בינה מלאכותית כבדים שיכולים לסייע בקריאת התמונות במהירות. במחקר זה מוצג מודל בינה מלאכותית קומפקטי חדש, שנקרא SqueezeViT, שנועד לזהות מחלות בחזה בצילומים תוך שימוש בכוח חישובי נמוך משמעותית ממערכות סטנדרטיות, מה שהופך אותו לפרקטי יותר בשירות הקליני.

גישה חדשה להקטנת קוראי תמונה חכמים

כלי זיהוי תמונה מודרניים נשענים לעתים קרובות על שתי רעיונות. רשתות נוירונים קונבולוציוניות טובות בזיהוי פרטים עדינים באזורים קטנים של התמונה, בעוד שמודלים מסוג Transformer חזותיים מסוגלים לתפוס את התמונה הכוללת ברחבי הסריקה. עם זאת, Vision Transformers סטנדרטיים כבדים ואיטיים. המחברים תכננו את SqueezeViT כדי לשמר את הראייה הרחבה של הטרנספורמרים אך "לסחוט" את כמות המידע שיש לעבד בכל שלב. המטרה היא לשמור על החלקים בתמונה החשובים לאבחון ולצמצם חישוב מיותר כדי שהמודל יוכל לפעול על חומרה צנועה.

Figure 1. בינה מלאכותית קומפקטית מסייעת לסווג צילומי חזה במדויק על מכשירי רפואה בעלי כוח חישובי מוגבל.
Figure 1. בינה מלאכותית קומפקטית מסייעת לסווג צילומי חזה במדויק על מכשירי רפואה בעלי כוח חישובי מוגבל.

כיצד המודל הקומפקטי רואה ריאות ולב

SqueezeViT משלב שני בלוקים מבניים כדי להתמודד ביעילות עם צילומי חזה. הראשון, שנקרא בלוק Fire, מתפקד כמסנן חכם שמדחס את המידע היוצא מהתמונה לקבוצת תכונות קטנה יותר, ואז מרחיב אותו שוב כדי להבליט דפוסים כמו קצוות וטקסטורות הקשורים למחלות. השני, שנקרא Translution Block, מחלק את התמונה לפאצ'ים קטנים ומיישם מנגנון תשומת לב (attention), מה שמאפשר למודל לקשר אותות משטחים מרוחקים של הריאות או הלב. באמצעות שימוש בפאצ'ים קצת גדולים יותר מאשר בעיצובים קודמים, המודל מצמצם את עומס העבודה שמנגנון התשומת לב צריך לבצע, ובכל זאת לוכד כיצד שינויים בחלק אחד של החזה מתקשרים לחלקים אחרים.

בדיקת המערכת

כדי לבדוק עד כמה SqueezeViT יעיל בפועל, החוקרים מעריכים אותו על שני אוספים ציבוריים גדולים של צילומי חזה: מאגר NIH ChestX-ray14 ומאגר CheXpert. יחד הם כוללים מאות אלפי תמונות המסומנות למגוון מצבים, כגון הגדלת הלב (cardiomegaly), בצקת, דלקת ריאות וגושים בריאה. הצוות מאמן את SqueezeViT מאפס ומשווה את יכולתו להבחין בין מקרים חולים לבריאים מול מודלים ידועים של למידה עמוקה, כולל כבדות כמו ResNet ו-DenseNet וכן אופציות קלות יותר כמו MobileNet, ShuffleNet, SqueezeNet ו-MobileViT. המדד עליו הם מתמקדים הוא השטח מתחת לעקומת Receiver Operating Characteristic (AUROC), ציון שמעניק יתרון למודלים שמדרגים מקרים חריגים לפני נורמליים על פני סף החלטה משתנה.

Figure 2. בינה מלאכותית קלת משקל "סוחטת" פרטי תמונה כדי לזהות בעיות ריאה בצילומי חזה שלב אחר שלב.
Figure 2. בינה מלאכותית קלת משקל "סוחטת" פרטי תמונה כדי לזהות בעיות ריאה בצילומי חזה שלב אחר שלב.

איזון בין מהירות, גודל ודיוק

התוצאות מראות כי SqueezeViT משיג דיוק ברמה של, ובמספר משימות אף גבוה יותר מאשר, מודלים גדולים בהרבה בעודו קטן משמעותית. הוא משתמש בכחצי מיליון פרמטרים ניתנים לאימון, מקטין את מספר הפרמטרים ביותר מ‑40 אחוז לעומת MobileViT ויותר מ‑90 אחוז מול כמה מהמודלים הגדולים ביותר שבקו הבסיס. החישובים, שימוש בזיכרון ועיכובי עיבוד הן על מעבדי גרפיקה והן על CPU רגילים מצטמצמים, מה שמאפשר לו לנתח תמונות בתוך כמה מילישניות על חומרה טיפוסית. בהגדרות של מספר מחלות בו־זמנית, SqueezeViT תואם או מתקרב לתוצאות של המודלים הכבדים הטובים ביותר במקרים רבים ומצטיין על פני עיצובים קלים אחרים. בהחלטות פשוטות של תקין מול לא תקין הוא שוב מספק ציונים חזקים ועקביים בשני המאגרים.

מה המשמעות לטיפול היומיומי

לקוראים ללא רקע טכני, המסר המרכזי הוא ש‑SqueezeViT מראה שאפשר לבנות עוזר בינה מלאכותית לצילומי חזה שהוא גם חסכוני במשאבי חישוב וגם דרוך בזיהוי מחלות. אף שאיננו מחליף את הצורך ברדיולוגים או קלינאים, הוא יכול לסייע לסמן במהירות סריקות חשודות בבתי חולים עמוסים ולהרחיב ניתוח מתקדם של תמונות למרפאות עם ציוד מוגבל. המחברים מציינים שתוויות מהעולם האמיתי עלולות להיות רועשות וכמה קטגוריות מחלה נשארות מאתגרות, אך הם מציעים שעיצוב קומפקטי זה הוא צעד מבטיח כלפי כלי תמיכה ניידים ואמינים לצילומי חזה, וייתכן שיוכל להיות מותאם בעתיד לסריקות נוספות כמו CT או MRI.

ציטוט: Maurya, A., Lohia, A., Chirag et al. Efficient SqueezeViT: A lightweight vision transformer framework for chest X-ray image classification. Sci Rep 16, 16183 (2026). https://doi.org/10.1038/s41598-026-47918-4

מילות מפתח: בינה מלאכותית לצילומי חזה, וויז'ן טרנספורמר, ניתוח תמונות רפואיות, למידה עמוקה קלת משקל, זיהוי מחלות ריאה