Clear Sky Science · it

Sfruttare l’apprendimento automatico multimodale per l’identificazione accurata del rischio di violenza da partner intimo

2026-03-13 · Torna all'indice

Perché i segnali di avvertimento nascosti sono importanti

La violenza in una relazione romantica è spesso tenuta segreta, anche nei confronti dei medici che osservano le lesioni che essa provoca. Eppure le cartelle cliniche conservano silenziosamente anni di indizi: visite ripetute al pronto soccorso, particolari schemi di lesioni e annotazioni su dolore o ansia. Questo studio si chiede se i computer siano in grado di leggere quegli indizi prima e in modo più affidabile rispetto alle semplici domande di screening attualmente usate, così che alle donne a rischio di violenza da partner intimo possa essere offerto aiuto molto prima di un punto di crisi.

Trasformare le cure di tutti i giorni in un sistema di allerta precoce

I ricercatori hanno utilizzato cartelle cliniche elettroniche provenienti da due grandi ospedali statunitensi, concentrandosi su donne che o si erano iscritte a un programma di intervento per abusi domestici o avevano diagnosi mediche correlate alla violenza da partner intimo. Per ciascuna di queste donne hanno selezionato pazienti simili per fascia d’età e contesto generale senza abusi documentati, creando un gruppo di confronto attentamente abbinato. Dal 2017 in poi, ogni contatto di queste pazienti con il sistema ospedaliero ha fornito dati: diagnosi, farmaci, esami di imaging, segni vitali, visite al pronto soccorso e note cliniche come referti radiologici o riassunti dei assistenti sociali.

Insegnare ai computer a leggere numeri e narrazioni

Il team ha costruito tre tipi di modelli predittivi, ciascuno pensato per un diverso livello di ricchezza dei dati nelle cliniche reali. Un modello utilizzava solo informazioni strutturate, come codici di diagnosi, storie di prescrizioni e conteggi di specifici esami di imaging. Un secondo modello si basava esclusivamente sulle note in testo libero, convertite in rappresentazioni numeriche usando moderni modelli linguistici medici originariamente addestrati su milioni di frasi cliniche. Il terzo, un modello di “fusione”, combinava entrambe le fonti: distillava schemi dalle tabelle e dalle narrazioni, per poi alimentare l’informazione unita in un classificatore di apprendimento automatico. Tutti i modelli sono stati addestrati a rispondere a una domanda quotidiana durante ogni contatto ospedaliero: questa paziente mostra segnali che possano indicare che sta subendo violenza da parte di un partner intimo?

Quanto hanno funzionato i segnali di rischio

Quando testati su donne non usate durante l’addestramento, tutti e tre i modelli sono stati in grado di distinguere con alta precisione quelle con abusi documentati dai loro controlli abbinati. Le prestazioni sono riassunte da una metrica chiamata AUC, dove 1,0 è perfetto e 0,5 non è meglio del caso. Il modello solo tabellare ha raggiunto un AUC di circa 0,85, il modello solo note circa 0,87 e il modello di fusione combinato circa 0,88. Crucialmente, questi risultati si sono mantenuti quando i modelli sono stati applicati a gruppi nuovi: donne che si sono iscritte al programma di intervento in anni successivi, donne in un secondo ospedale della stessa rete e donne con diagnosi correlate ad abusi ma che non sono mai entrate in un programma specializzato. In tutti i casi il modello di fusione è rimasto sopra un AUC di 0,8, suggerendo che la combinazione di numeri e testo rende il sistema sia accurato sia stabile in diversi contesti.

Rilevare schemi anni prima che le donne cerchino aiuto

Oltre a distinguere casi e controlli, i modelli spesso riconoscevano segnali di difficoltà molto prima che le donne rivelassero gli abusi agli specialisti. Confrontando la prima data in cui il modello segnalava alto rischio con la data in cui una donna entrava nel programma di intervento, i ricercatori hanno trovato “tempi di anticipo” medi superiori a tre anni, con molti casi segnalati oltre quattro o cinque anni prima. Il modello combinato ha identificato in anticipo una quota maggiore di futuri casi di abuso, mentre il modello solo tabellare a volte forniva un preavviso leggermente più lungo per i casi che effettivamente rilevava. Un’analisi delle caratteristiche strutturate ha evidenziato schemi di rischio in linea con ricerche cliniche precedenti: visite frequenti al pronto soccorso, alcuni esami di imaging degli arti superiori, elevato ricorso a analgesici, diagnosi di salute mentale e segnali di difficoltà sociale sono risultati associati a un rischio predetto maggiore, mentre gli screening preventivi di routine come le mammografie tendevano ad associarsi a un rischio inferiore.

Usare i punteggi di rischio senza togliere controllo

Gli autori sottolineano che questi strumenti non sono destinati a “diagnosticare” l’abuso né a sovrascrivere la voce della donna. Immaginano invece i modelli che operano silenziosamente in background nei sistemi di cartelle cliniche elettroniche, offrendo ai clinici un punteggio di rischio privato che possa stimolare conversazioni delicate e informate sul trauma e riferimenti tempestivi a supporti sociali e legali. Mettono inoltre in guardia sul fatto che i dati riflettono solo le donne il cui abuso è stato documentato o che hanno cercato aiuto, il che significa che alcuni gruppi restano sotto-rappresentati. Prima di una diffusione ampia, gli ospedali dovranno verificare le prestazioni in popolazioni più generali, monitorare la presenza di bias e progettare salvaguardie attente affinché i punteggi segnalati conducano a offerte di aiuto compassionevoli — non a pressioni o perdita di autonomia. Utilizzato in questo modo, l’apprendimento automatico multimodale potrebbe trasformare gli incontri medici di routine in un accesso anticipato e più affidabile alla sicurezza per le persone che subiscono violenza in ambito domestico.

Citazione: Gu, J., Carballo, K.V., Ma, Y. et al. Leveraging multimodal machine learning for accurate risk identification of intimate partner violence. npj Womens Health 4, 15 (2026). https://doi.org/10.1038/s44294-025-00126-3

Parole chiave: violenza da partner intimo, cartelle cliniche elettroniche, apprendimento automatico, dati multimodali, rilevazione precoce del rischio