Clear Sky Science · he
טרנספורמר בליווי חלש לאבחון מחלות נדירות וסוב‑פנוטיפינג מתוך רשומות בריאות אלקטרוניות עם מקרי מחלות ריאה
למה חשוב למצוא מחלות נדירות מהר יותר
למשפחות שחיות עם מחלות נדירות, לקבל שם לתופעה עלול לקחת שנים. התסמינים לעיתים מטושטשים, רופאים עשויים להיתקל רק במעט מאוד מקרים כאלה במשך הקריירה, ובדיקות קיימות לא תמיד נותנות תשובות ברורות. המחקר הזה חוקר דרך חדשה לנצל את העקבות הדיגיטליות שמושארות ברשומות הבריאות האלקטרוניות כדי לזהות שתי מחלות ריאה שקשה לאבחן מוקדם יותר ולסווג חולים לקבוצות שעתידות לעבור מסלולים קליניים שונים מאוד.

הדרך הארוכה לאבחנה נדירה
מחלות נדירות אינן שכיחות כל אחת בפני עצמה, אך יחד הן משפיעות על מאות מיליוני אנשים ברחבי העולם. רבות מהן מתחילות בילדות ועלולות להיות מסכנות חיים אם לא מאבחנים אותן. המאמר מתמקד במחלות ריאה נדירות, שבהן תלונות יומיומיות כמו קוצר נשימה או צפצופים עלולות להיטעה בקלות כאסתמה או בעיות שכיחות אחרות. כתוצאה מכך, ילדים עם מצבים כגון יתר לחץ דם ריאתי או צורות קשות של אסתמה עשויים לעבור רופאים רבים ולהמתין שנים עד לקבלת האבחנה הנכונה, ובכך לאבד זמן יקר שבו טיפול מוקדם יכול לשנות את מהלך המחלה.
הפיכת רשומות רפואיות מבולגנות לרמזים
בתי חולים מודרניים מאחסנים כמויות עצומות של מידע ברשומות בריאות אלקטרוניות, מקודי אבחנה ותרופות ועד בדיקות מעבדה והערות רופאים. בחבילה הזאת של נתונים חבויים דפוסים שיכולים לרמוז על מחלה נדירה עוד לפני שהיא נקראת בשמה. אך יש בעיה: רק אחוז קטן מהחולים עבר סקירה מדוקדקת על‑ידי מומחים, ולכן תוויות איכותיות שאומרות מי באמת חולה נדירות. ברוב הרשומות יש רק אותות גסים ו״רעשניים״ — קודים שעשויים לשקף ענייני גבייה, השערות ראשוניות או תיוגים ישנים. מודלים מסורתיים מתקשים בסביבה כזו מאחר שהם בנויים ללמוד מאוספים גדולים של דוגמאות נקיות ואמינות.
דרך חדשה ללמוד מנתונים לא מושלמים
המחברים מציגים את WEST, "טרנספורמר בעל פיקוח חלש" שמתוכנת ללמוד מתערובת של מעט תוויות מדויקות והרבה תוויות לא ודאיות. המערכת מתחילה בשתי קבוצות של מטופלים בבוסטון צ׳ילדרנס הוספיטל שעשויים להיות עם יתר לחץ דם ריאתי או אסתמה קשה, מזוהים על‑ידי קודי סקר רחבים. בתוך כל קבוצה, תת־קבוצה קטנה אומתה על‑ידי מומחים, בעוד ששאר המטופלים קיבלו ציונים הסתברותיים מכלים חוקים‑מבוססים מוקדמים. WEST משתמש בטרנספורמר — ארכיטקטורה מתקדמת למציאת דפוסים שפיתחו במקור לשפה — כדי להפוך את כל היסטוריית הרפואית של כל ילד לפרופיל מספרי דחוס. קריטי בכך הוא שלא מטפלים בתוויות הגסות כאמת מוחלטת: לאחר כל סבב אימון, המודל מעדכן את האומדנים שלו למי סביר שחולה ומזין את ההסתברויות המעודכנות חזרה לסבב הבא, ובאופן הדרגתי מנקה את האות.

מה המודל גילה במחלות ריאה
כאשר נבחן על מטופלים שאומתו על‑ידי מומחים והיו מופרדים מערכת האימון, WEST היה מדויק יותר ממספר חלופות, כולל כללי ספירת קודים פשוטים, עצי החלטה משופרים (gradient‑boosted trees) וטרנספורמרים שהתעלמו מהתוויות הרועשות או קיבלו אותן כפי שהן. הוא זקוק לכמות מפתיעה קטנה של דוגמאות סטנדרטיות־זהב כדי לתפקד היטב — כ־100 מטופלים שנבדקו בקפידה הספיקו כדי להתאים או להתעלות על גישות אחרות. מעבר לזהות מי כנראה חולה בכל מצב, הייצוגים הפנימיים של המודל קיבצו באופן טבעי ילדים לצברים קליניים בעלי משמעות. בעניין יתר לחץ דם ריאתי, WEST הפריד מטופלים לקבוצה מתקדמת באיטיות ולקבוצה מתקדמת במהירות, שהציגה דפוסי הישרדות שונים בבירור לאורך חמש שנים. לגבי אסתמה קשה, הוא פיצל מטופלים לאלה עם ההתגברות חוזרת ותכופה ומסוכנת ולאלה עם פחות התקפים יחסית, בהתאמה להבדלים באשפוזים, באירועי חמצן נמוך ובכישלון נשימתי.
איך זה עשוי לשנות את טיפול המטופלים
ללא‑מומחה, המסר המרכזי הוא ש‑WEST לומד "לראות" דפוסי מחלה מורכבים בנתוני שגרה של בתי חולים מבלי להסתמך על מערכי נתונים עצומים ומתוייגים באופן מושלם. על‑ידי מיחזור חכם של אותות לא מושלמים וכמות קטנה של קלט מומחה, הוא יכול לסמן מקרים סבירים של מחלות נדירות בדיוק רב יותר ולחשוף תת‑קבוצות נסתרות שנושאות סיכונים שונים. בטווח הארוך, מערכות כמו WEST עשויות לקצר את מסע האבחון לילדים עם מחלות ריאה נדירות, להנחות רופאים להפנות מוקדם למומחים, ולתמוך במעקב וטיפול מותאמים יותר על‑פי האופן שבו מחלת המטופל צפויה להתפתח.
ציטוט: Greco, K.F., Yang, Z., Li, M. et al. A weakly supervised transformer for rare disease diagnosis and subphenotyping from EHRs with pulmonary case studies. npj Digit. Med. 9, 211 (2026). https://doi.org/10.1038/s41746-026-02406-x
מילות מפתח: אבחון מחלות נדירות, רשומות בריאות אלקטרוניות, למידת מכונה ברפואה, יתר לחץ דם ריאתי, אסתמה קשה