Clear Sky Science · he
השוואת אסטרטגיות השלמת נתונים חסרים בסדרות זמן בטיפול נמרץ באמצעות תרחישים בהשראת העולם האמיתי
למה מילוי חורים בנתונים חשוב עבור חולי טיפול נמרץ
ביחידות טיפול נמרץ מודרניות כל פעימת לב, נשימה ופעימת לחץ דם מוקלטים כזרם רציף של מספרים. עם זאת, במציאות הזרמים הללו מלאים בחורים: חיישנים נופלים, מטופלים יוצאים למעבדות או סריקות והתקנים מכובים לזמן קצר. כאשר רופאים ומחשבים משתמשים ברשומות החסרות הללו כדי לחזות את עתיד החולה או להנחות טיפול, הדרך שבה "ממלאים" את החלקים החסרים יכולה לשנות בעדינות את הסיפור שהנתונים מספרים. המחקר שואל שאלה מעשית עם משמעות רבה: מתוך מגוון רחב של אסטרטגיות מילוי—משורות ישרות פשוטות ועד לבינה מלאכותית מתקדמת—אילו מהן עובדות הכי טוב תחת סוגי החורים שמתרחשים בפועל ביחידות טיפול נמרץ?

מבט מקרוב על הסימנים החיוניים בטיפול נמרץ
החוקרים התבססו על MIMIC-IV, מאגר ציבורי גדול של אשפוזים ביחידות טיפול נמרץ ממוסרי זהות מבית חולים בארה"ב. הם התמקדו ב-26,167 אשפוזים של מבוגרים ובחנו את 48 השעות הראשונות לאחר קבלת החולה ליחידה, ועקבו אחר ארבעה סימנים חיוניים שנמדדים ברציפות לצד המיטה: דופק, רמת חמצן בדם, קצב נשימה ולחץ דם ממוצע. כדי לשמור על ריאלי, קריאות בלתי אפשריות הוסרו וכל המדידות סוכמו פעם בשעה. כל שעה שבה לא נרשמה ערך לסימן חיוני נתנה כנגזרת כחסרה. אף על פי שכ-4% בלבד מכל הערכים נעדרו, הצוות מצא שהחורים הללו לא הופיעו באקראי—לעיתים הם הצטברו בשעות המאוחרות של חלון ה-48 ושפגעו לעתים במספר סימנים חיוניים במקביל.
כיצד שוחזרו חורי נתונים בסגנון העולם האמיתי
במקום לייצר דפוסים חסרים מלאכותיים בלבד, המחברים בנו שלושה תרחישים בהשראת מה שראו בנתונים הגולמיים ומה שרופאים חווים ליד המיטה. בתרחיש הראשון נמחקו קריאות בודדות באקראי, מחיקה המדמה מדידות אבודות שלעיתים מתרחשות. בתרחיש השני נעלמו יחד חסימות של שעה עד שלוש על פני כל ארבעת הסימנים, המייצגות זמנים כשהמטופל אינו מחובר למוניטורים—למשל בזמן סריקה. בתרחיש השלישי הוסרו רצף של ארבע שעות עבור סימן חיוני אחד בלבד—למשל לחץ דם—מה שמשקף חיישן תקול או חיבור שנפל. כל תרחיש הסיר כ-30% מהנתונים, מה שייצר מבחן רציני לכל שיטה השואפת לשחזר את העקומות המקוריות.
טריקים ישנים מול אינטליגנציה מכוונת מודרנית
הצוות השווה מערך רחב של שיטות שיקום. שיטות פשוטות כללו מילוי כל חור בערך הממוצע של המטופל, נשיאת הקריאה האחרונה קדימה או שרטוט קו ישר בין הנקודות הקרובות הידועות. כלים סטטיסטיים מתקדמים יותר ניסו לחזות ערכים חסרים מתוך שאר הסימנים, אך בכך נאלצו ליישר את מימד הזמן ולטפל בכל שעה כשורה בטבלה. בקצה השני של הסקלה עמדו מודלים של למידה עמוקה—טרנספורמרים, רשתות חוזרות ומודלים גנרטיביים—שלומדים במפורש דפוסים על פני זמן ובין משתנים. כל המודלים אומנו על נתונים שבהם 30% מהערכים הוסתרו באקראי, ואז נבחנו בכל אחד מהשלושה תרחישי ההסתרה. הביצועים נמדדו עד כמה השחזורים סטו מהמספרים המקוריים, עם הקפדה מיוחדת על שגיאות בלחץ דם ממוצע, אות קריטי לניהול מחזור הדם.

מה עבד, מתי ובאיזה היקף
באופן כללי, המודלים המתקדמים ביותר—במיוחד גישה מבוססת טרנספורמר ורשת גנרטיבית מתחרה—הניבו את שגיאות הממוצע הנמוכות ביותר, במיוחד כאשר החורים היו קצרים או מפוזרים. עם זאת, שיטה צנועה—אינטרפולציה בקו ישר—הציגה ביצועים מרשימים והתקרבה למודלים הנוירוניים במצבים רבים. כלים סטטיסטיים שהזניחו את סדר המדידות, כגון יערות אקראיים ומשוואות משולבות, נותרו מאחור על אף המורכבות שלהם. צורת החורים גם היא הייתה חשובה. כאשר הערכים נעלמו באקראי, כל השיטות נראות טובות יותר, מה שנותן תמונה אופטימית מדי של דיוקן. חורים ארוכים ורציפים ברשומה, במיוחד על פני מספר שעות או חיישן בודד כושל, היו הרבה יותר קשים למילוי נכון. בהגדרות הקשות האלה, שיטות הלמידה העמוקה הטובות ביותר הידרדרו בעדינות רבה יותר בהשוואה לשיטות פשוטות, אך השיפורים היו לעתים צנועים כאשר תורגמו ליחידות לחץ דם ממשיות.
למה הממצאים חשובים להחלטות לצד המיטה
בתחומי לחץ דם שגרתיים, ההבדל בין מודלים עמוקים מובילים לאינטרפולציה פשוטה היה לעתים רק כמה מילימטרים כספית—בדרך כלל קטן מדי כדי לשנות החלטת רופא. יחד עם זאת, כל השיטות, כולל המתקדמות שבהן, נאבקו כאשר לחץ הדם היה נמוך מאוד או גבוה מאוד—הרגעים שבהם ניטור קפדני חשוב במיוחד. המסקנה היא שבחירה באיך להתמודד עם נתונים חסרים ביחידת טיפול נמרץ היא לא פחות עניין של הבנת אופן ומיקום הופעת החורים מאשר בחירת האלגוריתם האחרון. מודלים משוכללים יכולים להציע שיפורים מדורגים, במיוחד עבור חורים ארוכים או מורכבים יותר, אך שיטות פשוטות ושקופות עשויות להספיק לשימושים מעשיים רבים. חשוב לזכור שגם מילוי טוב יותר לא מבטיח אוטומטית מודלים חזויים טובים יותר; יש צורך בעבודות עתידיות שיבחנו כיצד בחירות ההשלמה משפיעות על החלטות קליניות אמיתיות.
ציטוט: Poette, M., Mouysset, S., Ruiz, D. et al. Benchmarking imputation strategies for missing time-series data in critical care using real-world-inspired scenarios. Sci Rep 16, 8116 (2026). https://doi.org/10.1038/s41598-026-39035-z
מילות מפתח: סדרות זמן ביחידות טיפול נמרץ, נתונים חסרים, שיטות השלמה, למידה עמוקה, סימנים חיוניים