Clear Sky Science · he

סיווג דלקת ריאות מרובת קטגוריות בחצי‑מנחה בעזרת מסגרת CNN‑cascade forest

· חזרה לאינדקס

מדוע בדיקות דלקת ריאות חכמות יותר חשובות

דלקת הריאות נשארת אחת הסיבות המובילות למוות בעולם, ובכל זאת בתי חולים רבים—ובייחוד אלה עם פחות מומחים—עדיין מסתמכים על בדיקה ויזואלית של רופאים העמוסים הבוחנים צילומי חזה ברנטגן או סריקות CT. זה מקשה לא רק לזהות דלקת ריאות, אלא גם להבחין בסוג שלה: חיידקי, ויראלי, פטרייתי, או תבנית דלקתית כללית יותר. מאמר זה מתאר מערכת בינה מלאכותית חדשה שנועדה לסייע. היא משתמשת גם בתמונות רנטגן וגם ב‑CT, לומדת גם מסריקות שלא סומנו על‑ידי מומחים, ויכולה להבחין בין תת‑סוגים שונים של דלקת ריאות בדיוק מרשים.

Figure 1
Figure 1.

ממעבר חד‑ערכי לפתרונות עשירים יותר

מרבית הכלים הקיימים לזיהוי זיהומי ריאה דומים לגלאי עשן בסיסי: הם מודיעים "דלקת ריאות" או "אין דלקת ריאות" ועוצרים שם. רופאים זקוקים לעומת זאת לדקויות גדולות יותר. סיבות שונות לדלקת ריאות מגיבות לתרופות שונות, נושאות סיכונים שונים, ולעתים נראות שונה באופן עדין בהדמיה. החוקרים שאפו לבנות מערכת שיכולה להבחין בין חמש קטגוריות—חיידקי, ויראלי, פטרייתי, דלקת ריאות כללית וריאות תקינות—כדי שכלי אוטומטי יספק הכוונה קרובה יותר לזו שאפי רדיולוג מנוסה נותן, במקום התראה חד‑משמעית בלבד.

שילוב שני סוגי סריקות לתמונה מלאה יותר

להכשרה ולמבחן השיטה, החוקרים אספו מערך נתונים של 4,578 תמונות חזה שנלקחו ממאגרי ציבור: כל מטופל תרם הן רנטגן והן סריקת CT שנרכשו במהלך אותו אירוע קליני. רנטגנים מהירים וזולים אך מטושטשים יחסית; סריקות CT איטיות ויקרות יותר אך מציגות פרטים מבניים עדינים. בהתאמה זהירה בין שתי המודאליות ברמת המטופל ובהסרת מקרים לא עקביים או שמפקירים ספק, הקבוצה יצרה מערך נתונים ריאלי ולא מאוזן המשקף את הרפואה היומיומית: סוגים מסוימים של דלקת ריאות, כמו זיהום פטרייתי, נדירים בהרבה מאחרים.

כיצד ההיבריד לומד מסריקות מסומנות ובלתי‑מסומנות

המערכת המוצעת, שנקראת CNN‑Enhanced Cascade Forest (CE‑Cascade), משלבת שני סוגי למידת מכונה. ראשית, רשת קונבולוציה עמוקה ידועה כ‑ResNet מעבדת כל תמונה והופכת אותה ל"טביעת אצבע" מרובת ממדים שתופסת מרקמים, צורות ותבניות המקושרות לדלקת ריאות. במקום לחזות ישירות את האבחנה, טביעות אלה מועברות ל"cascade forest"—שכבות מרובות של אנסמבל עצי החלטה שמחדדות את האות שוב ושוב, מתמקדות בתתי‑אזורים מקומיים בתמונה ובונות דפוסים מורכבים יותר בכל שלב. באופן מכריע, המחברים משבצים את המודל ההיברידי במסגרת חצי‑מנחה: לאחר שגרסה ראשונית מאומנת על סריקות שסומנו על‑ידי מומחים, מותר לה להקצות "תוויות פסאודו" לתמונות בלתי‑מסומנות, אך רק כאשר היא מאוד בטוחה. מקרים בעלי ביטחון גבוה אלה נשזרים חזרה לאימון, ומרחיבים את מערך הנתונים היעיל ללא עבודה אנושית נוספת.

Figure 2
Figure 2.

מה המערכת השיגה בפועל

באמצעות גישה זו, מודל CE‑Cascade השיג דיוק סיווג כולל של 98.86 אחוזים בחמש הקטגוריות, עם ציונים גבוהים דומים הן על נתוני רנטגן והן על נתוני CT. הוא לא רק עלה על רשתות עצביות פשוטות אלא גם החריג מתחרים מתקדמים יותר, כולל מודלים קונבולוציוניים עמוקים עם מנגנוני תשומת לב ומערכות מבוססות טרנספורמר. הוספת סריקות עם תוויות פסאודו שיפרה בעקביות את איכות התחזיות, הגבירה מספר מדדי הערכה והפכה את המודל לעמיד יותר בפני מעט סימוני מומחה. השיטה גם הכלילה היטב כאשר הוכשרה על מודאליות אחת ונבחנה על האחרת, מה שמרמז שהיא למדה דפוסים הקשורים למחלה ולא רק תכונות של סוג מסוים של סורק.

ממבחן מעבדה לעוזר ליד המיטה

ללא‑מומחים, המסקנה המרכזית היא שעבודה זו מקרבת את הדמיית חזה בסיוע בינה לכלי שרופאים יכולים להשתמש בו בפועל. במקום כלי תיבת‑שחורה שאומר רק "דלקת ריאות: כן או לא," מסגרת CE‑Cascade מציעה פלט מפורט רב‑קטגורי והיא יעילה דיו לפריסה שוטפת. על‑ידי למידה מסריקות מסומנות ובלתי‑מסומנות ובנצל שדרים משלימים של רנטגן ו‑CT, היא מציבה רף גבוה למערכות עתידיות. אם תתורגם לתוכנה קלינית ותושלם בהסברים ברורים על איזורי התמונה שמניעים את החלטותיה, מודל כזה עשוי לעזור לרופאים לבצע טריאז' מהיר יותר, לבחור טיפולים מתאימים יותר ולהביא פרשנות תמונה ברמת מומחה לבתי חולים שחסרים אותה כיום.

ציטוט: Muthukumaraswamy, P., Yuvaraj, T. & Krishnamoorthy, R. Semi-supervised multi-class pneumonia classification using a CNN-cascade forest framework. Sci Rep 16, 7448 (2026). https://doi.org/10.1038/s41598-026-38849-1

מילות מפתח: הדמיית דלקת ריאות, בינה רפואית, צילום חזה ברנטגן, סריקת CT, למידה חצי‑מנחה