Clear Sky Science · he
אבחון מצב תפקודי תנועה ברשומות רפואיות אלקטרוניות באמצעות מודלים גדולים של שפה
מדוע יכולת הליכה היא אינדיקטור בריאותי רב‑עוצמה
בזמן שאנשים חיים יותר זמן, הרופאים מתמקדים לא רק במשך החיים אלא גם בכמה טוב אנחנו יכולים לזוז, ללכת ולטפל בעצמנו. קשיים בקימה מכיסא, בעלייה במדרגות או בהתניידות בעיר מופיעים לעתים קרובות זמן רב לפני משבר רפואי. עם זאת, התיאורים המפורטיים ביותר של יכולות יומיומיות של אדם בדרך‑כלל קבורים בפניות חופשיות של רופאים ופיזיותרפיסטים ברשומות הרפואיות האלקטרוניות, שם קשה למחשבים למצוא אותם. המחקר הזה בוחן האם מודלים גדולים של שפה—אותו סוג של בינה מלאכותית שעומד מאחורי הרבה צ׳אטבוטים—יכולים לקרוא את הפניות האלה באופן אמין ולהפוך תיאורי תנועה למידע מובנה וניתן לחיפוש.

הפיכת פתקים מבולגנים לנתוני ניידות ברי‑שימוש
החוקרים התמקמו ב"מצב תפקודי של ניידות", מונח רחב שמתייחס ליכולת של אדם לשנות עמידה, ללכת, לשאת ולטפל בחפצים, להשתמש בתחבורה ולהתנייד בחיי היומיום. הם השתמשו ב‑600 תיעודים קליניים אמיתיים משלוש מוסדות בריאות במינסוטה ובוויסקונסין, רובם מביקורי פיזיותרפיה והעסוקתי, בנוסף לערכה של תיעודים כלליים יותר. אנוטטורים מומחים עברו על כל תיעוד בפירוט, חלק אחרי חלק, וסימנו כל קטע שתיאר אחד מחמשת קטגוריות הניידות, תוך ציון אם המטופל מוגבל בבירור ("מוגבל") או מתפקד כרגיל ("לא מוגבל"). התוויות המומחיות האלה שימשו כסטנדרט זהב להערכת המערכת המבוססת על בינה מלאכותית.
כיצד המודל האוטומטי הוכשר לקרוא כמו קלינאי
הצוות השתמש ב‑Llama 3, מודל שפה גדול בקוד פתוח, והריץ אותו על שרתים מקומיים מאובטחים כך שנתוני המטופלים לא יעזבו את מערכת הבריאות. במקום לאמן את המודל מאפס, הם תכננו בקפידה פרומפטים—סטים של הוראות כתובות והגדרות—שילמדו את המודל מה לחפש. הם ניסו פרומפטים "אפס‑דוגמאות" (zero‑shot), שמספקים רק הוראות, ו"מעט‑דוגמאות" (few‑shot), הכוללים גם כמה דוגמאות של תיעודים. לאחר מכן הם ניתחו היכן המודל טעה ונסחו פרומפט "מונחה‑שגיאות" שהסביר מה לכלול, מה להתעלם ממנו (כמו תוכניות טיפול עתידיות), ואיך לטפל במקרים מסובכים כמו נפילות, סחרחורות או שימוש בכיסא גלגלים. התבקש מה-AI, עבור כל חלק בתיעוד וכל קטגוריית ניידות, האם הניידות הוזכרה בכלל ואם כן — האם המטופל מוגבל.
ביצועים חזקים שמשתפרים ברמת המטופל
כאשר הושוו לתוויות המומחים, המערכת המודרגת הציגה ביצועים טובים. ברמת המטופלים כיחידה שלמה—שילוב מידע מכל תיעודיהם—ה‑AI הגיע לציון F1 (מדד דיוק מקובל) של כ‑0.88 בזיהוי מידע על ניידות וכ‑0.90 בקביעת האם האדם מוגבל. משמעות הדבר היא שהשיפוטים שלו תואמים במידה רבה את אלה של הסוקרים האנושיים. הביצועים היו מעט נמוכים יותר ברמת חלקי התיעוד היחידים, שם הניסוח יכול להיות דל או עמום, אך הדיוק השתפר ככל שאוגדו המידע על פני תיעודים שלמים ואז על פני כל התיעודים של מטופל. בניתוח נוסף, החוקרים קיבלו "הסקות קליניות סבירות" כהצדקה—למשל, להניח שכאב חזק בברך במהלך הליכה כנראה מגביל הליכה, גם אם זה לא נכתב במפורש. בתצפית מקלה זו, ציון F1 ברמת המטופל עלה מעל 0.96 עבור חילוץ המידע ו‑0.95 עבור סיווג המוגבלות.

מה ה‑AI טעה בו — ולמה זה עדיין חשוב
רוב השגיאות נבעו מהמקום שבו המודל קרא בין השורות. הוא ניבא לעתים קרובות בעיות ניידות בהתבסס על כאב, סחרחורת או תוכניות טיפול עתידיות, גם כאשר התיעוד לא ציין במפורש שהמטופל מוגבל. שגיאות אחרות השתקפו באזורים אפורים בהגדרות, כמו האם נפילות חוזרות צריכות להיחשב כבעית הליכה או כבעית שיווי משקל בעת שינוי עמידה. הקטגוריה "ניידות, לא מוגדר" שנועדה ללכוד פעילויות יומיומיות ותרגילים הייתה קשה במיוחד להגדיר במדויק. על אף הבעיות הללו, רוב הטעויות היו הגיוניות מבחינה קלינית ולא אקראיות או מוזרות. על‑ידי הרצת המודל באופן דטרמיניסטי (ללא אקראיות פנימית) על שרתים מקומיים נעולים, הצוות גם הבטיח שהתוצאות יהיו לשחזור וששמירת פרטיות המטופל נשמרה.
כיצד זה יכול לשנות את הטיפול במבוגרים
לציבור הרחב, המסקנה היא שמערכת AI יכולה כיום לקרוא פקודות שגרתיות של רופאים ופיזיותרפיסטים היטב מספיק כדי לסכם עד כמה מטופלים ניידים והיכן הם מתקשים. משמעות הדבר שמערכות בריאות יכולות לעקוב אחרי שינויים בהליכה, בשיווי המשקל ובפעילויות היומיומיות לאורך זמן ללא הוספת שאלונים או בדיקות חדשות, לזהות אנשים בסיכון גבוה לנפילות או להשארת אשפוז, ולמצוא מי עלול להרוויח מפיזיותרפיה או מהערכות בטיחות בבית. על‑ידי המרת מיליוני תיעודים חופשיים לנתוני ניידות מובנים, גישה זו מסייעת לרופאים לראות תמונה רחבה יותר של האופן שבו הזדקנות ומחלה משפיעות על חיי היומיום — ומקרבת את מערכת הבריאות לרפואה מותאמת אישית המתמקדת בתפקוד.
ציטוט: Liu, X., Garg, M., Jia, H. et al. Mobility functional status ascertainment in electronic health records using large language models. Sci Rep 16, 6045 (2026). https://doi.org/10.1038/s41598-026-37025-9
מילות מפתח: ניידות, רשומות רפואיות אלקטרוניות, מודלים גדולים של שפה, מצב תפקודי, בינה מלאכותית קלינית