Clear Sky Science · fr
Exploiter l’apprentissage automatique multimodal pour identifier avec précision le risque de violences conjugales
Pourquoi les signes d’alerte cachés comptent
La violence dans une relation amoureuse reste souvent secrète, y compris face aux médecins qui constatent les blessures qu’elle cause. Pourtant, les dossiers médicaux conservent discrètement des indices sur des années : consultations répétées aux urgences, certains schémas de blessures et des notes faisant état de douleur ou d’anxiété. Cette étude s’interroge pour savoir si des ordinateurs peuvent lire ces indices plus tôt et de manière plus fiable que les questionnaires de dépistage simples d’aujourd’hui, afin que les femmes exposées au risque de violences conjugales puissent se voir proposer de l’aide bien avant l’apparition d’une crise.

Transformer les soins quotidiens en système d’alerte précoce
Les chercheuses et chercheurs se sont appuyés sur des dossiers médicaux électroniques de deux grands hôpitaux américains, en se concentrant sur des femmes inscrites dans un programme d’intervention contre les violences domestiques ou porteuses de diagnostics médicaux liés aux violences conjugales. Pour chacune de ces femmes, ils ont sélectionné des patientes similaires en âge et en profil général sans abus documenté, constituant ainsi un groupe témoin soigneusement apparié. À partir de 2017, chaque contact de ces patientes avec le système hospitalier a alimenté les données : diagnostics, médicaments, examens d’imagerie, constantes vitales, visites aux urgences et notes cliniques telles que comptes rendus de radiologie ou synthèses d’assistantes sociales.
Apprendre aux ordinateurs à lire chiffres et récits
L’équipe a construit trois types de modèles prédictifs, chacun pensé pour un niveau différent de richesse des données dans les cliniques réelles. Un modèle utilisait uniquement l’information structurée, comme les codes de diagnostic, les antécédents médicamenteux et le nombre d’examens d’imagerie spécifiques. Un deuxième modèle s’appuyait uniquement sur les notes en texte libre, converties en représentations numériques à l’aide de modèles de langage médical modernes initialement entraînés sur des millions de phrases cliniques. Le troisième, modèle de « fusion », combinait les deux sources : il extrayait des motifs des tableaux et des récits, puis alimentait l’information fusionnée dans un classifieur d’apprentissage automatique. Tous les modèles étaient entraînés pour répondre à une question quotidienne lors de chaque contact hospitalier : cette patiente présente‑t‑elle des signes pouvant indiquer qu’elle subit des violences conjugales ?
Quelle a été l’efficacité des signaux de risque
Lorsqu’on les a testés sur des femmes non utilisées pendant l’entraînement, les trois modèles ont su distinguer avec une forte précision celles avec abus connu de leurs témoins appariés. La performance se résume par une métrique appelée AUC, où 1,0 est parfait et 0,5 équivaut au hasard. Le modèle basé uniquement sur le tableau a atteint un AUC d’environ 0,85, le modèle sur les notes d’environ 0,87 et le modèle de fusion combiné environ 0,88. Surtout, ces résultats ont tenu lorsque les modèles ont été appliqués à de nouveaux groupes : des femmes inscrites au programme d’intervention dans les années suivantes, des femmes d’un second hôpital du même réseau et des femmes ayant des diagnostics liés aux violences sans jamais entrer dans un programme spécialisé. Dans tous les cas, le modèle de fusion est resté au‑dessus d’un AUC de 0,8, ce qui suggère que le mélange de chiffres et de texte rend le système à la fois précis et stable selon les contextes.

Détecter des schémas plusieurs années avant que les femmes ne demandent de l’aide
Au‑delà de la séparation cas/témoins, les modèles repéraient souvent des signes de difficultés bien avant que les femmes ne confient les violences à des spécialistes. En comparant la première date à laquelle le modèle signalait un risque élevé avec la date d’entrée d’une femme dans le programme d’intervention, les chercheuses et chercheurs ont observé des « avances » moyennes de plus de trois ans, de nombreux cas étant signalés plus de quatre ou cinq ans à l’avance. Le modèle combiné a identifié une plus grande part des futurs cas d’abus tôt, tandis que le modèle uniquement tabulaire donnait parfois un préavis légèrement plus long pour ceux qu’il détectait. Une analyse des caractéristiques structurées a mis en évidence des motifs de risque en accord avec des recherches cliniques antérieures : consultations fréquentes aux urgences, certains examens d’imagerie des membres supérieurs, forte utilisation d’antalgiques, diagnostics de santé mentale et signes de difficultés sociales étaient tous associés à un risque prédit plus élevé, tandis que des bilans de prévention routiniers comme les mammographies avaient tendance à s’associer à un risque plus faible.
Utiliser des scores de risque sans retirer le contrôle
Les auteurs insistent sur le fait que ces outils ne visent pas à « diagnostiquer » un abus ni à faire taire la parole de la femme. Ils envisagent plutôt que les modèles tournent discrètement en arrière‑plan des systèmes de dossiers électroniques, offrant aux cliniciens un score de risque privé qui peut inciter à des conversations délicates, informées par le trauma, et à des orientations opportunes vers des soutiens sociaux et juridiques. Ils avertissent aussi que les données ne reflètent que les femmes dont l’abus a été documenté ou qui ont cherché de l’aide, ce qui laisse certains groupes sous‑représentés. Avant un déploiement généralisé, les hôpitaux devront tester la performance sur des populations plus générales, surveiller les biais et concevoir des garanties strictes pour que les scores signalés conduisent à des offres d’aide compatissantes — et non à des pressions ou à une perte d’autonomie. Utilisé de cette manière, l’apprentissage automatique multimodal pourrait transformer les rencontres médicales quotidiennes en une porte d’entrée plus précoce et plus fiable vers la sécurité pour les personnes confrontées à la violence domestique.
Citation: Gu, J., Carballo, K.V., Ma, Y. et al. Leveraging multimodal machine learning for accurate risk identification of intimate partner violence. npj Womens Health 4, 15 (2026). https://doi.org/10.1038/s44294-025-00126-3
Mots-clés: violences conjugales, dossiers médicaux électroniques, apprentissage automatique, données multimodales, détection précoce du risque