Clear Sky Science · sv
Förbättrad personanpassad förutsägelse av självmordsrisk för VA‑patienter genom integration av distinkta modeller för naturlig språkbehandling
Varför denna forskning är viktig
Självmord bland militärveteraner är en allvarlig folkhälsokris, ändå missar våra bästa förutsägelseverktyg fortfarande många som löper risk, särskilt de som inte verkar vara i uppenbar fara. Denna studie undersöker om datorer kan lära sig mer av orden i veteraners journalanteckningar för att bättre upptäcka vilka som kan behöva hjälp, med särskilt fokus på dem som i dag klassificeras som endast låg- eller måttlig risk.

Se bortom de sedvanliga siffrorna
U.S. Department of Veterans Affairs (VA) använder redan ett system kallat REACH‑VET för att flagga veteraner med högst självmordsrisk. REACH‑VET förlitar sig på ”strukturerad” information som passar väl i tabeller, såsom diagnoser, tidigare sjukhusvistelser eller om någon någonsin rapporterat självtankar. Även om detta är kraftfullt fungerar det bäst för patienter som ofta använder VA‑tjänster och genererar mycket sådan data. Veteraner med färre besök, eller vars svårigheter inte fångas helt av kryssrutor och koder, kan förbises trots att de är i fara.
Göra läkarnas anteckningar till användbara signaler
Mycket av det kliniker vet om en patient finns i fria textanteckningar snarare än i prydliga fält. Forskarna utnyttjade dessa skriftliga anteckningar—tagna inom 5 till 30 dagar före dödsfallet för veteraner som avled genom självmord, och i samma tidsfönster för matchade veteraner som inte gjorde det—för att se om språkmönster kunde skärpa riskbedömningen. De jämförde två sätt att bearbeta text. Det ena var en ”semantisk” metod som utgår från expertbyggda ordböcker som fångar begrepp som familjeband, njutning eller negativa känslor. Det andra var en ”räknings”metod som helt enkelt räknar hur ofta specifika ord eller korta fraser förekommer, och låter data avslöja mönster utan förhandsantaganden.
Kombinera två perspektiv på språk
Med dessa ingredienser byggde teamet maskininlärningsmodeller som försökte skilja veteraner som avled genom självmord från liknande veteraner som inte gjorde det, separat inom tre grupper: hög, måttlig och låg förväntad risk enligt REACH‑VET. De skapade modeller som använde endast semantiska funktioner, endast ordräkningar, eller en hybrid av båda. För att rättvist blanda de två textansatserna justerade de modellen så att semantiska funktioner, som är färre till antalet, fortfarande skulle kunna påverka beslut jämte de betydligt fler räknefunktionerna. Prestanda mättes med en standardmetrik som i grunden frågar hur ofta modellen ger en högre riskpoäng till någon som avled genom självmord än till en matchad person som inte gjorde det.

Vad modellerna upptäckte
I samtliga tre riskgrupper presterade modeller baserade enbart på ordräkningar generellt bättre än modeller som enbart använde semantiska ordböcker. De mest framgångsrika modellerna för veteraner i de måttliga och låga REACH‑VET‑nivåerna var däremot hybrider som lutade tungt mot ordräkningar samtidigt som de tog viss information från semantiska mått. Dessa kombinerade modeller nådde måttliga förbättringar jämfört med REACH‑VET ensam, med de största vinsterna för veteraner som initialt bedömdes ha låg risk—dessa hade också ofta färre vårdkontakter och mindre strukturerad data. De språkmönster som var viktiga skilde sig mellan grupperna: hög‑riskanteckningar betonade akuta psykiska problem, måttlig‑riskanteckningar framhöll vårdprocesser, och låg‑riskanteckningar lutade mot allmänmedicinska och rehabiliteringsteman samt tecken på sociala band eller deras frånvaro.
Konsekvenser för vård och förebyggande arbete
Dessa fynd tyder på att ostrukturerad text i elektroniska journaler innehåller värdefulla ledtrådar som kan förfina uppskattningar av självmordsrisk, särskilt för personer som inte redan tillhör den högsta riskkategorin. Genom att blanda enkla ordräkningsmönster med mer teoridrivna semantiska signaler, och anpassa modeller till olika risknivåer, kan vårdsystem kanske upptäcka sårbara veteraner tidigare och utforma interventioner som passar deras nivå och typ av risk. För patienter med lägre risk kan detta innebära lättare stödinsatser som automatiska uppföljningar, remisser till kamratstöd eller välbefinnandeprogram, eller rutinmässiga samtal om sociala och känslomässiga utmaningar vid ordinarie besök.
Vad detta betyder för veteraner och kliniker
Enkelt uttryckt visar studien att uppmärksamhet på hur kliniker beskriver sina patienter—vid sidan av traditionella medicinska data—kan göra verktyg för självmordsförutsägelse mer känsliga för veteraner som annars kan falla mellan stolarna. Även om förbättringarna är måttliga och tillvägagångssättet fortfarande behöver testas i realtid i kliniska miljöer, utgör det ett konkret steg mot mer personanpassad, datadriven självmordsförebyggande som hjälper inte bara dem i uppenbar kris utan också dem vars risk är tystare, mer komplex och lättare att missa.
Citering: Dimambro, M., Levy, J., Gui, J. et al. Enhancing personalized suicide risk prediction for VA patients by integrating discrete natural language processing models. Transl Psychiatry 16, 196 (2026). https://doi.org/10.1038/s41398-026-03940-8
Nyckelord: självmordsrisk bland veteraner, elektroniska journaler, naturlig språkbehandling, riskprediktionsmodeller, psykisk sjukvård