Clear Sky Science · es

Mejora de la predicción personalizada del riesgo de suicidio en pacientes del VA integrando modelos discretos de procesamiento de lenguaje natural

2026-03-20 · Volver al índice

Por qué importa esta investigación

El suicidio entre veteranos militares es una crisis de salud pública apremiante, y aun así nuestras mejores herramientas de predicción siguen dejando fuera a muchas personas en riesgo, especialmente aquellas que no muestran señales evidentes de peligro. Este estudio explora si los ordenadores pueden aprender más a partir de las palabras escritas en las historias clínicas de los veteranos para identificar mejor quién puede necesitar ayuda, con un enfoque particular en quienes actualmente se clasifican solo como de riesgo bajo o moderado.

Más allá de los números habituales

El Departamento de Asuntos de los Veteranos de EE. UU. (VA) ya emplea un sistema llamado REACH‑VET para señalar a los veteranos con mayor riesgo de suicidio. REACH‑VET se basa en información “estructurada” que encaja bien en tablas, como diagnósticos, hospitalizaciones previas o si alguien ha informado pensamientos suicidas. Aunque potente, este enfoque funciona mejor para pacientes que usan con frecuencia los servicios del VA y generan muchos de esos datos. Los veteranos con menos visitas, o cuyas dificultades no quedan plenamente reflejadas en casillas y códigos, pueden pasar desapercibidos a pesar de estar en peligro.

Convertir las notas de los médicos en señales útiles

Gran parte de lo que los clínicos saben sobre un paciente vive en notas de texto libre en lugar de en campos ordenados. Los investigadores aprovecharon estas notas escritas —registradas entre 5 y 30 días antes del fallecimiento en veteranos que murieron por suicidio, y en la misma ventana temporal para veteranos emparejados que no murieron— para ver si los patrones en el lenguaje podían afinar la predicción de riesgo. Compararon dos formas de procesar el texto. Una fue un método “semántico” que parte de diccionarios construidos por expertos que recogen ideas como vínculos familiares, placer o sentimientos negativos. La otra fue un método de “conteo” que simplemente contabiliza con qué frecuencia aparecen palabras específicas o frases cortas, permitiendo que los datos revelen patrones sin suposiciones previas.

Combinar dos miradas sobre el lenguaje

Con estos insumos, el equipo construyó modelos de aprendizaje automático que intentaron distinguir a los veteranos que murieron por suicidio de veteranos similares que no lo hicieron, de forma separada dentro de tres grupos: riesgo alto, moderado y bajo según REACH‑VET. Crearon modelos que usaban únicamente características semánticas, únicamente conteos de palabras o un híbrido de ambas. Para combinar de forma justa los dos enfoques textuales, ajustaron el modelo de modo que las características semánticas, que son menos numerosas, tuvieran aún la oportunidad de influir en las decisiones junto a las mucho más numerosas características de conteo. El rendimiento se midió usando una métrica estándar que plantea, en esencia, con qué frecuencia el modelo asigna una puntuación de riesgo más alta a alguien que murió por suicidio que a una persona emparejada que no lo hizo.

Lo que descubrieron los modelos

En los tres grupos de riesgo, los modelos basados únicamente en conteos de palabras generalmente superaron a los modelos que usaban solo diccionarios semánticos. Sin embargo, los modelos más exitosos para los veteranos en los niveles moderado y bajo de REACH‑VET fueron híbridos que se apoyaron en gran medida en los conteos de palabras, sin dejar de extraer algo de información de las medidas semánticas. Estos modelos combinados lograron mejoras moderadas frente a REACH‑VET por sí solo, con las mayores mejoras en los veteranos inicialmente etiquetados como de bajo riesgo, que además tendían a tener menos encuentros médicos y menos datos estructurados. Los patrones de lenguaje relevantes difirieron según el grupo: las notas de alto riesgo enfatizaban problemas de salud mental agudos, las de riesgo moderado destacaban procesos de atención, y las de bajo riesgo se inclinaron hacia temas médicos generales y de rehabilitación, así como señales de conexión social o su ausencia.

Implicaciones para la atención y la prevención

Estos hallazgos sugieren que el texto no estructurado en los registros electrónicos de salud contiene pistas valiosas que pueden refinar las estimaciones de riesgo de suicidio, especialmente para personas que no están ya en la categoría de mayor riesgo. Al combinar patrones simples de conteo de palabras con señales semánticas más teóricas, y adaptar los modelos a diferentes niveles de riesgo, los sistemas de salud podrían detectar a veteranos vulnerables antes y diseñar intervenciones acordes con su nivel y tipo de riesgo. Para pacientes de menor riesgo, esto podría significar apoyos de menor intensidad como comprobaciones automatizadas, referencias a programas de pares o de bienestar, o discusiones rutinarias sobre desafíos sociales y emocionales en visitas regulares.

Qué significa esto para veteranos y clínicos

En términos sencillos, el estudio muestra que prestar atención a cómo los clínicos describen a sus pacientes —además de los datos médicos tradicionales— puede hacer que las herramientas de predicción del suicidio sean más sensibles a los veteranos que de otro modo podrían pasar desapercibidos. Si bien las mejoras son moderadas y el enfoque aún debe probarse en entornos clínicos en tiempo real, constituye un paso concreto hacia una prevención del suicidio más personalizada e informada por datos que sirva no solo a quienes están en crisis evidente, sino también a quienes presentan un riesgo más silencioso, complejo y fácil de pasar por alto.

Cita: Dimambro, M., Levy, J., Gui, J. et al. Enhancing personalized suicide risk prediction for VA patients by integrating discrete natural language processing models. Transl Psychiatry 16, 196 (2026). https://doi.org/10.1038/s41398-026-03940-8

Palabras clave: riesgo de suicidio en veteranos, historiales clínicos electrónicos, procesamiento de lenguaje natural, modelos de predicción de riesgo, atención de salud mental