Clear Sky Science · he
אגירת תשומת‑לב ברמת המחלקה ודלילות טוקנים בטרנספורמרים חזותיים לפרשנות רנטגן חזה
רנטגנים חכמים למחלה ריאתית עולמית
השחפת נותרת אחת מהמחלות הזיהומיות המסוכנות ביותר בעולם, וצילומי חזה הם לעתים קרובות הבדיקה הדמיונית הראשונה והיחידה הזמינה במרפאות צפופות, במיוחד במדינות בעלות הכנסה נמוכה ובינונית. אולם קריאת המצלבים האלה קשה וגוזלת זמן, גם בקרב מומחים. המחקר הזה מציג מערכת בינה מלאכותית שתוכננה לא רק לזהות סימנים לשחפת בצילומי חזה בדיוק גבוה מאוד, אלא גם להראות לרופאים בדיוק אילו אזורים בריאות השפיעו על ההחלטה שלה, במטרה לבנות אמון ולתמוך באבחון מהיר ועמיד יותר.
למה קריאת תמונות חזה כל כך מאתגרת
צילומי חזה זולים, מהירים וזמינים ברבים, מה שהופך אותם לכלי אטרקטיבי לסקר מסיבי. הבעיה היא ששחפת יכולה להופיע באופן עדין שקל לפספס, במיוחד כאשר התמונות רעשניות, חשופות פחות או יותר מדי, או צולמו בציוד ישן. קוראים אנושיים עשויים להסתייג זה מזה, ומרפאות עמוסות עלולות להעמיס על רדיולוגים. תוכניות מחשב מסורתיות ניסו להתמודד עם הבעיה על‑ידי מדידת מאפיינים שנוצרו בעבודת יד בתמונות והזנתם למודלים סטנדרטיים של למידת מכונה, אך מערכות מוקדמות אלו נאבקו כשסריקות הגיעו מבתי חולים חדשים או תחת הגדרות טכניות שונות.
מרשתות עצביות לתשומת‑לב ממוקדת חזותית
למידה עמוקה, ובייחוד רשתות קונבולוציה, שיפרה את המצב על‑ידי לימוד דפוסים ישירות מפיקסלים והשגת תוצאות חזקות במערכי נתוני שחפת. עם זאת, רשתות אלה מתמקדות בעיקר בשכנות מקומית בתמונה ועלולות לפספס דפוסים רחבי טווח החוצים את שתי הריאות. מודלים חדשים שנקראים טרנספורמרים חזותיים רואים את הצילום כהיט של חתיכות קטנות ולומדים כיצד כל חתיכה מתקשרת עם האחרות, ובכך תופסים מבנים לטווח ארוך. אמנם חזקים, טרנספורמרים זמינים עשויים לשים תשומת לב לאזורים בלתי חשובים ויכולים להיות קשים לפרשנות, מה שמעלה חששות האם החלטותיהם מתיישבות עם חשיבה קלינית.

צינורית בינה מלאכותית מותאמת לסריקות ריאה
המחברים תכננו טרנספורמר חזותי מותאם להתמודדות עם חולשות אלה עבור צילומי חזה. בראש ובראשונה, כל תמונה עוברת עיבוד מקדים קפדני: היא משנה גודל, מנורמלת ולעתים מועברת דרך טכניקת שיפור קונטרסט שמדגישה נגעי ריאה חלשים תוך הימנעות מהחרפה יתרה. שלב קונבולוציה קל משקל בקידמת המודל מחלץ פרטים עדינים כגון קצוות ומרקמים החשובים בדימויים רפואיים. הסריקה מחולקת אז לכתמים קטנים, שכל אחד מהם מומר לטוקן שהטרנספורמר יכול לעבד.
להדריך את המודל היכן למקד את המבט
כדי לסייע למערכת לעקוב אחרי האנטומיה, המודל משתמש במנגנון קידוד-מיקום שמזרז מידע לגבי מיקום כל כתם בתוך הריאות, במקום להתייחס לכל המיקומים כאילו הם ניתנים להחלפה. הוא גם מציג טוקני "מחלקה" מיוחדים, טוקן אחד לכל קטגוריית מחלה, שלומדים לאסוף את הראיות הרלוונטיות ביותר מכל הכתמים. אסטרטגיית דלילות מעודדת את הרשת להסתמך רק על תת‑קבוצה של הטוקנים המידעיים ביותר, ובכך לדחות דפוסי רקע ורעש. מתכון האימון כולל טכניקות כמו השמטה אקראית של טוקנים, תזמון זהיר של קצב הלמידה וחישוב דיוק מעורב, שנבחרו לייצב את הלמידה על נתונים רפואיים מוגבלים ולהימנע מהתאמה יתר לתכונות משונות של תמונות האימון.

לראות מה ה‑AI רואה
באופן מכריע, המערכת נבנתה כדי להסביר את עצמה. לאחר חיזוי של "שחפת" או "נורמלי", המודל מייצר מפות חום באמצעות שיטה הידועה כ‑Grad‑CAM. שכבות צבע אלו מדגישות אילו אזורי ריאה השפיעו ביותר על ההחלטה. המחברים תכננו את צינור ההסבר שלהם כדי להציג דוגמאות מאוזנות גם ממקרים חולים וגם ממקרים בריאים, כך שרדיולוגים יוכלו לוודא שהכלי מסתכל על מבנים בעלי משמעות קלינית ולא על ארטיפקטים חסרי רלוונטיות. בשני מערכי נתונים פתוחים לשחפת הגישה השיגה דיוק אימות קרוב ל‑98 אחוז ואזור מתחת לעקומה המתקרב להבחנה מושלמת, אם כי המחברים מזהירים שהפרדת הנתונים ברמת התמונה עלולה להעריך יתר על המידה במקצת את הביצועים בעולם האמיתי ושהיא עדיין זקוקה לבדיקות חיצוניות.
מה משמעות הדבר לטיפול עתידי
במלים פשוטות, עבודה זו מראה מערכת בינה מלאכותית היכולה לסמן במהירות ובדייקנות מקרים חשודים לשחפת על צילומי חזה ובו בזמן לצייר "מפה" חזותית ברורה של טיעוניה. כלי כזה יכול לסייע במיון חולים במרפאות עם משאבים מוגבלים, להפחית מקרים מפוספסים ולספק חוות דעת משנית עקבית לרדיולוגים. יחד עם זאת, המחברים מדגישים שמודלם נבדק רק על שני מערכי נתונים ציבוריים, מתמקד בתווית מחלה יחידה וחסר אימות קליני מלא. צעדי המשך כוללים הרחבת השיטה למספר מצבים ריאתיים, התאמה לסריקות תלת‑ממד כגון CT, אימות ההסברים עם רדיולוגים ובחינה של המודל בבתי חולים שונים. עם זאת, המחקר מסמן צעד מבטיח לעבר בינה מלאכותית שאינה רק מדויקת, אלא גם שקופה ואמינה במאבק נגד השחפת.
ציטוט: Lokunde, V., Sundar, K., Khokhar, A. et al. Class-attention pooling and token sparsity based vision transformers for chest X-ray interpretation. Sci Rep 16, 8035 (2026). https://doi.org/10.1038/s41598-026-37109-6
מילות מפתח: שחפת, צילום חזה, טרנספורמר חזותי, בינה מלאכותית להסבר, דימות רפואי