Clear Sky Science · es

Aprovechar el aprendizaje automático multimodal para la identificación precisa del riesgo de violencia por pareja íntima

2026-03-13 · Volver al índice

Por qué importan las señales de advertencia ocultas

La violencia en una relación sentimental suele mantenerse en secreto, incluso frente a los médicos que atienden las lesiones que provoca. Sin embargo, las historias clínicas almacenan silenciosamente años de pistas: consultas repetidas en urgencias, determinados patrones de lesiones y anotaciones sobre dolor o ansiedad. Este estudio plantea si los ordenadores pueden leer esas pistas antes y con más fiabilidad que las preguntas de cribado simples que se usan hoy, de modo que a las mujeres en riesgo de violencia por pareja íntima se les pueda ofrecer ayuda mucho antes de que llegue una situación de crisis.

Convertir la atención cotidiana en un sistema de alerta temprana

Los investigadores recurrieron a historias clínicas electrónicas de dos grandes hospitales de EE. UU., centrando su estudio en mujeres que o bien se inscribieron en un programa de intervención por violencia doméstica o bien tenían diagnósticos médicos relacionados con violencia por pareja íntima. Para cada una de estas mujeres, seleccionaron pacientes similares de la misma franja de edad y contexto general que no tenían constancia de abuso, creando un grupo de comparación cuidadosamente emparejado. A partir de 2017, cada encuentro que estas pacientes tuvieron con el sistema hospitalario aportó datos: diagnósticos, medicamentos, pruebas de imagen, signos vitales, visitas a urgencias y notas clínicas como informes de radiología o resúmenes de trabajadoras sociales.

Enseñar a los ordenadores a leer números y relatos

El equipo construyó tres tipos de modelos predictivos, cada uno diseñado para un distinto nivel de riqueza de datos en las clínicas reales. Un modelo utilizó solo información estructurada, como códigos de diagnóstico, historiales de prescripciones y conteos de pruebas de imagen específicas. Un segundo modelo se basó únicamente en las notas de texto libre, que se convirtieron en representaciones numéricas usando modernos modelos de lenguaje médico entrenados originalmente con millones de oraciones clínicas. El tercero, un modelo de “fusión”, combinó ambas fuentes: destiló patrones de las tablas y de los relatos, y luego alimentó la información fusionada a un clasificador de aprendizaje automático. Todos los modelos se entrenaron para responder a una pregunta diaria durante cada contacto hospitalario: ¿muestra esta paciente señales de que podría estar sufriendo violencia por pareja íntima?

Qué tan bien funcionaron las señales de riesgo

Al evaluarlos en mujeres no utilizadas durante el entrenamiento, los tres modelos pudieron distinguir con alta precisión a quienes tenían abuso documentado de sus controles emparejados. El rendimiento se resume mediante una métrica llamada AUC, donde 1,0 es perfecto y 0,5 equivale al azar. El modelo solo con datos tabulares alcanzó una AUC de aproximadamente 0,85, el de solo notas alrededor de 0,87 y el modelo combinado de fusión cerca de 0,88. De forma crucial, estos resultados se mantuvieron cuando se aplicaron los modelos a grupos nuevos: mujeres que se inscribieron en el programa de intervención en años posteriores, mujeres en un segundo hospital de la misma red y mujeres con diagnósticos relacionados con abuso que nunca ingresaron en un programa especializado. En todos los casos, el modelo de fusión se mantuvo por encima de una AUC de 0,8, lo que sugiere que mezclar números y texto hace que el sistema sea a la vez preciso y estable entre diferentes entornos.

Detectar patrones años antes de que las mujeres pidan ayuda

Más allá de distinguir casos de controles, los modelos con frecuencia reconocieron problemas mucho antes de que las mujeres revelaran el abuso a especialistas. Al comparar la primera fecha en que el modelo señalaba alto riesgo con la fecha en que la mujer entró en el programa de intervención, los investigadores hallaron “ventanas de aviso” medias de más de tres años, con muchos casos señalados cuatro o cinco años antes. El modelo combinado identificó una mayor proporción de casos futuros de abuso con antelación, mientras que el modelo solo tabular a veces ofrecía un aviso ligeramente más largo para los casos que sí detectaba. Un análisis de las características estructuradas resaltó patrones de riesgo que coinciden con estudios clínicos previos: visitas frecuentes a urgencias, ciertas pruebas de imagen en extremidades superiores, alto uso de analgésicos, diagnósticos de salud mental y signos de dificultades sociales se asociaron con mayor riesgo previsto, mientras que los cribados preventivos de rutina, como las mamografías, tendieron a asociarse con menor riesgo.

Usar puntuaciones de riesgo sin quitar autonomía

Los autores subrayan que estas herramientas no pretenden “diagnosticar” el abuso ni invalidar la voz de la mujer. En cambio, imaginan que los modelos funcionen en segundo plano dentro de los sistemas de registros electrónicos, ofreciendo a los clínicos una puntuación de riesgo privada que pueda provocar conversaciones sensibles y con perspectiva de trauma, y derivaciones oportunas a apoyos sociales y legales. También advierten de que los datos reflejan solo a las mujeres cuyo abuso fue documentado o que buscaron ayuda, lo que significa que algunos grupos siguen estando subrepresentados. Antes de una implementación amplia, los hospitales deberán evaluar el rendimiento en poblaciones más generales, vigilar posibles sesgos y diseñar salvaguardas cuidadosas para que las puntuaciones señaladas conduzcan a ofertas de ayuda compasivas —no a presión ni a pérdida de autonomía. Usado así, el aprendizaje automático multimodal podría convertir los encuentros médicos cotidianos en una puerta de entrada más temprana y fiable hacia la seguridad para las personas que sufren violencia en el hogar.

Cita: Gu, J., Carballo, K.V., Ma, Y. et al. Leveraging multimodal machine learning for accurate risk identification of intimate partner violence. npj Womens Health 4, 15 (2026). https://doi.org/10.1038/s44294-025-00126-3

Palabras clave: violencia por pareja íntima, historias clínicas electrónicas, aprendizaje automático, datos multimodales, detección temprana de riesgo