Clear Sky Science · he
שיפור תחזיות מותאמות אישית לסיכון התאבדות עבור מטופלי ה‑VA באמצעות שילוב מודלים בדידים לעיבוד שפה טבעית
מדוע המחקר הזה חשוב
התאבדות בקרב חיילים משוחררים מהווה משבר בריאות ציבורית דחוף, ועדיין כלי התחזית הטובים ביותר שלנו מפספסים רבים הנמצאים בסיכון, במיוחד אלה שאינם נראים בסכנה מיידית. מחקר זה בוחן האם מחשבים יכולים ללמוד יותר מהמילים שבתרשימים הרפואיים של הוותיקים כדי לזהות טוב יותר מי עשוי להזדקק לעזרה, עם דגש על אלה שסווגו כרגע רק בסיכון נמוך או בינוני.

מראים מעבר למספרים השגרתיים
משרד שירותי הוותיקים של ארה"ב (VA) כבר משתמש במערכת שנקראת REACH‑VET כדי לסמן ותיקים בסיכון הגבוה ביותר להתאבדות. REACH‑VET מתבסס על מידע "מובנה" שניתן לסדר בטבלאות, כגון אבחנות, אשפוזים בעבר או האם מישהו דיווח אי‑פעם על מחשבות התאבדותיות. אף על פי שהשיטה חזקה, היא עובדת הכי טוב עבור מטופלים שמשתמשים בשירותי ה‑VA בתדירות גבוהה ומייצרים הרבה כזה נתונים. ותיקים עם פחות ביקורים, או שקשייהם אינם מתוארים במלואם בתיבות סימון וקודים, יכולים להישמט מהתשומות למרות שהם בסכנה.
להפוך את הערות הרופאים לאיתותים שימושיים
רוב מה שמטפלים יודעים על מטופל מתועד בטקסט חופשי ולא בשדות מסודרים. החוקרים ניצלו את ההערות הכתובות הללו — שנלקחו בתוך חלון של 5 עד 30 יום לפני המוות עבור ותיקים שמתו בהתאבדות, ובאותו חלון עבור ותיקים מותאמים שלא מתו — כדי לבדוק האם דפוסי שפה יכולים לחדד את תחזית הסיכון. הם השוו שתי דרכים לעיבוד הטקסט. אחת הייתה שיטה "סמנטית" המתחילה ממילונים שנבנו על‑ידי מומחים ותופסים רעיונות כמו קשרי משפחה, הנאה או רגשות שליליים. השנייה הייתה שיטת "מניין" שסופרת פשוט כמה פעמים מילים או ביטויים קצרים מופיעים, ומאפשרת לנתונים לחשוף דפוסים ללא הנחות מוקדמות.
שילוב שתי עדשות על השפה
בעזרת רכיבים אלה, הצוות בנה מודלים למידת מכונה שניסו להבחין בין ותיקים שמתו בהתאבדות לבין ותיקים דומים שלא מתו, בנפרד בתוך שלוש קבוצות: סיכון גבוה, בינוני ונמוך כפי שחושבה על‑ידי REACH‑VET. הם יצרו מודלים שהשתמשו אך ורק בתכונות סמנטיות, אך ורק במנייני מילים, או בהיבריד של השניים. כדי לאזן בצורה הוגנת בין הגישות לטקסט, הם התאימו את המודל כך שהתכונות הסמנטיות, שהן מועטות יותר במספר, עדיין יקבלו הזדמנות להשפיע לצד תכונות המניין הרבה יותר רבות. הביצועים נמדדו באמצעות מדד סטנדרטי הבוחן, במידה מסוימת, עד כמה המודל נותן ציון סיכון גבוה יותר למי שמת בהתאבדות לעומת אדם מותאם שלא מת.

ממצאי המודלים
בכל שלוש קבוצות הסיכון, מודלים שהתבססו אך ורק על מנייני מילים הצליחו בדרך כלל יותר ממודלים שהשתמשו רק במילונים סמנטיים. עם זאת, המודלים המוצלחים ביותר עבור ותיקים במדרגות הביניים והנמוכות של REACH‑VET היו היברידיים שפנו במידה רבה למנייני מילים ועדיין שאבו מידע מסוים מהמדדים הסמנטיים. מודלים משולבים אלה השיגו שיפורים מתונים על פני REACH‑VET לבדו, עם השיפורים הגדולים ביותר עבור ותיקים שסווגו בתחילה בסיכון נמוך, שאף נטו לערוך פחות פגישות רפואיות ולהיות בעלי פחות נתונים מובנים. דפוסי השפה שהשפיעו נבדלו לפי קבוצה: ההערות של בעלי הסיכון הגבוה הדגישו בעיות בריאות הנפש החריפות, הערות הביניים הדגישו תהליכי טיפול, והערות הסיכון הנמוך נטו לכיוון נושאים רפואיים כלליים ושיקום, כמו גם סימנים לקיום חיבור חברתי או לחוסר כזה.
השלכות עבור טיפול ומניעה
ממצאים אלה מצביעים על כך שטקסט בלתי‑מובנה בתיקים רפואיים אלקטרוניים מכיל רמזים בעלי ערך שיכולים לשפר את הערכות הסיכון להתאבדות, במיוחד לאנשים שאינם כבר בקטגוריית הסיכון הגבוהה ביותר. על‑ידי שילוב דפוסי מניין פשוטים עם איתותים סמנטיים מבוססי תיאוריה, והתאמת מודלים לסוגי סיכון שונים, מערכות בריאות עשויות לזהות ותיקים פגיעים מוקדם יותר ולעצב התערבויות התואמות לרמת ולסוג הסיכון שלהם. עבור מטופלים בסיכון נמוך יותר, זה עשוי לכלול תמיכה מקלה כגון בדיקות אוטומטיות תקופתיות, הפניות לתוכניות עמיתים או בריאות ורווחה, או דיונים שגרתיים על אתגרים חברתיים ורגשיים בביקורים רגילים.
מה המשמעות עבור ותיקים וצוותים קליניים
במילים פשוטות, המחקר מראה כי קשב לאופן שבו מטפלים מתארים את מטופליהם — לצד נתונים רפואיים מסורתיים — יכול להפוך את כלי החיזוי של התאבדות לרגישים יותר לוותיקים שעשויים אחרת ליפול בין הסדקים. למרות שהרווחים מתונים ושיטה זו עדיין זקוקה לבחינה בזמן אמת בסביבות קליניות, היא מהווה צעד קונקרטי לעבר מניעת התאבדות מותאמת אישית ומבוססת נתונים שמשרתת לא רק את אלה במשבר מובן, אלא גם את אלה שסיכונם שקט, מורכב וקל יותר לפספס.
ציטוט: Dimambro, M., Levy, J., Gui, J. et al. Enhancing personalized suicide risk prediction for VA patients by integrating discrete natural language processing models. Transl Psychiatry 16, 196 (2026). https://doi.org/10.1038/s41398-026-03940-8
מילות מפתח: סיכון התאבדות של ותיקים, תיק רפואי אלקטרוני, עיבוד שפה טבעית, מודלים לחיזוי סיכון, טיפול בבריאות הנפש