Clear Sky Science · he
שיטת למידה עמוקה היברידית שמשלבת CNN וטרנספורמר למיון סריקות CT של ריאות
מדוע מחקר זה חשוב לחולים ולמשפחות
סרטן הריאה נחשב לאחד הסרטנים הקטלניים בעולם, בעיקר כי לעתים קרובות הוא מאובחן באיחור. מחקר זה בוחן כיצד חזון ממוחשב מתקדם יכול לסייע לרופאים לקרוא סריקות CT של הריאות ביתר דיוק ועקביות, כך שנקודות חשודות בריאה יזוהו מוקדם יותר ובשגיאות פחותות — מה שעלול לתמוך בקבלת החלטות קלינית מהירה ומושכלת יותר.
להסתכל בתוך החזה בעיניים דיגיטליות
רופאים מסתמכים לעתים קרובות על סריקות CT כדי לחפש גידולים זעירים בריאות שיכולים להעיד על סרטן. גידולים אלה, שנקראים קשריות, יכולים להיות מאוד קטנים ודקים, במיוחד בשלבים המוקדמים של המחלה. רקמת ריאה תקינה, קשריות לא מזיקות וגידולים מסוכנים עלולים להיראות דומים אף למומחים מנוסים. שינויים קלים באיכות התמונה, ברקמת הרקע או ברעש בסריקה עלולים להסתיר עוד יותר את ההבדלים. בשל כך חלק מהסרטנים עלולים להחמיץ, בעוד שממצאים אחרים מעוררים אזעקות שווא שמובילות לבדיקות מיותרות.

להדריך מחשבים לזהות דפוסים בסריקות ריאה
החוקרים תכננו מערכת למידה עמוקה בשם C‑Swin שתעזור למיין תמונות CT של ריאות לשלוש קטגוריות: תקין, שפיר (לא סרטני) וממאיר (סרטני). מערכות למידה עמוקה לומדות ישירות ממספר גדול של תמונות דוגמה, במקום להסתמך על חוקים שנכתבו ביד. C‑Swin משלב שתי רעיונות רבי‑עוצמה: סוג של רשת עצבית המכונה רשת קונבולוציה (CNN) מתמקדת בפרטים עדינים כמו קצוות, מרקמים וצורות קטנות הגלומים במבנה הקשרית. במקביל, מודול הטרנספורמר, שמקור השראתו בכלים לתרגום שפה, בוחן את התמונה בקנה מידה רחב יותר, תוך שקלול היחסים בין אזורים לאורך כל הריאה.
להתמקד במה שבאמת חשוב בתמונה
כדי להפיק את המיטב מסריקות ה‑CT, הצוות הציג מנגנון תשומת לב מיוחד שעוזר למודל להתרכז באזורים הרלוונטיים ולהתגבר על הסחות רקע. תמונת ה‑CT מחולקת לטלאים או חלונות קטנים. בתוך חלונות אלה לומד המודל אילו אזורים נושאים את המידע המועיל ביותר להערכת תקינות הרקמה. על‑ידי הזזה ושילוב של חלונות בכיוונים שונים, הרשת שומרת על קשרים בין אזורים שכנים ותופסת גם פרטים מקרוב וגם מבנים במרחב הרחוק של הריאות. רכיב סינון נוסף עוזר למערכת להדגיש דפוסים עדינים אך חשובים ולהדכא אותות פחות מועילים, ובכך משפר את יכולת המודל להבחין בין קשריות לא מזיקות לאלה המסכנות חיים.

המבחן המעשי
המחברים אימנו והעריכו את C‑Swin באמצעות מאגר CT זמין בציבור שאסף תמונות מבתי חולים בעיראק, הכולל דוגמאות של ריאות בריאות, קשריות שפירות ומקרים ממאירים. מכיוון שמאגרים רפואיים נוטים להיות קטנים, הם הרחיבו את מערך האימון באמצעות הגדלת נתונים, כמו היפוך וסיבוב של תמונות, כדי לדמות שונות רחבה יותר של סריקות. לאחר עיבוד מוקדם ואימון קפדני, המודל סיווג נכונה תמונות בדיוק של כ‑96% והשיג ציונים גבוהים דומים בדיוק, שליפה ו‑F1, מדדים שמאזנים בין סרטנים שלא זוהו לבין אזעקות שווא. בבדיקות חוזרות עם חלוקות שונות של הנתונים התוצאות נשארו יציבות, ובדיקות סטטיסטיות הראו ש‑C‑Swin התברר כטוב משמעותית מכמה גישות למידה עמוקה קיימות.
מה זה עשוי להעניק לטיפול בעתיד
למרות שמחקר זה אינו מחליף את שיקול דעתו של רדיולוג, הוא מראה ששילוב מתוכנן בקפידה של ניתוח מקומי וגלובלי של התמונה יכול לסייע למחשבים להתמקד באותם אזורי ריאה שמומחים רואים כחשובים. ויזואליזציות Grad‑CAM, שמדגישות את אזורי התמונה המשפיעים על החלטות המודל, מצביעות על כך ש‑C‑Swin נוטה להתמקד באזורי פגיעה יותר מאשר ברקע לא רלוונטי. המחברים מציינים שהעבודה מבוססת על מאגר יחיד יחסית קטן, ולכן יש צורך בבדיקות רחבות יותר בבתי חולים שונים ועל סורקים מגוונים. אם יאומת על אוספים גדולים ומגוונים יותר של סריקות, מערכות כאלה עשויות להפוך לעוזרים מועילים בחדר הקריאה, לסייע לרופאים לתעדף מקרים, לצמצם החמצות ולתמוך בזיהוי מוקדם יותר של סרטן הריאה.
ציטוט: Yousafzai, S.N., Nasir, I.M., Mansour, S. et al. A hybrid deep learning approach integrating CNN and transformer for lung cancer classification using CT scans. Sci Rep 16, 15420 (2026). https://doi.org/10.1038/s41598-026-41161-7
מילות מפתח: סרטן ריאה, הדמיית CT, למידה עמוקה, בינה רפואית, מיון תמונות