Clear Sky Science · nl
Multimodale machine learning inzetten voor nauwkeurige risico-identificatie van partnergeweld
Waarom verborgen waarschuwingssignalen ertoe doen
Geweld in een romantische relatie wordt vaak verborgen gehouden, zelfs voor artsen die de verwondingen zien. Toch bewaren medische dossiers stilletjes jaren aan aanwijzingen: herhaalde spoedbezoeken, specifieke verwondingspatronen en aantekeningen over pijn of angst. Deze studie onderzoekt of computers die aanwijzingen eerder en betrouwbaarder kunnen lezen dan de eenvoudige screeningsvragen die nu vaak worden gebruikt, zodat vrouwen met risico op partnergeweld al ver voor een crisispunt hulp kunnen krijgen.

Alledaagse zorg omvormen tot een vroegwaarschuwingssysteem
De onderzoekers gebruikten elektronische medische dossiers van twee grote Amerikaanse ziekenhuizen, met de focus op vrouwen die ofwel waren opgenomen in een interventieprogramma tegen huiselijk geweld of medische diagnoses hadden die verband hielden met partnergeweld. Voor elk van deze vrouwen selecteerden ze vergelijkbare patiënten van dezelfde leeftijdsgroep en brede achtergrond zonder gedocumenteerd misbruik, waarmee een zorgvuldig afgestemde controlegroep ontstond. Vanaf 2017 droeg elk contact van deze patiënten met het ziekenhuisstelsel data bij—diagnoses, medicijnen, beeldvormende onderzoeken, vitale functies, spoedbezoeken en klinische notities zoals radiologierapporten of samenvattingen van maatschappelijk werkers.
Computers leren getallen en verhalen lezen
Het team bouwde drie typen voorspellingsmodellen, elk ontworpen voor een verschillend niveau van gegevensrijkdom in reële klinieken. Eén model gebruikte alleen gestructureerde informatie, zoals diagnosecodes, medicatiegeschiedenis en tellingen van specifieke beeldvormende onderzoeken. Een tweede model baseerde zich uitsluitend op de vrije-tekstnotities, die werden omgezet in numerieke representaties met moderne medische taalmodellen die oorspronkelijk op miljoenen klinische zinnen waren getraind. Het derde model, een “fusie”-model, combineerde beide bronnen: het destilleerde patronen uit tabellen en uit de narratieven en voerde de samengevoegde informatie vervolgens in een machine-learningclassificator. Alle modellen werden getraind om bij elk ziekenhuiscontact dagelijks één vraag te beantwoorden: vertoont deze patiënte signalen die kunnen duiden op intiem partnergeweld?
Hoe goed de risicosignalen werkten
Getest op vrouwen die niet in de training waren gebruikt, konden alle drie de modellen degenen met bekende misbruikgevallen onderscheiden van hun afgestemde controles met hoge nauwkeurigheid. De prestaties worden samengevat met een maatstaf genaamd AUC, waarbij 1,0 perfect is en 0,5 niet beter dan toeval. Het uitsluitend-tabulaire model behaalde een AUC van ongeveer 0,85, het uitsluitend-notitiesmodel circa 0,87 en het gecombineerde fusie-model ongeveer 0,88. Cruciaal is dat deze resultaten standhielden toen de modellen op nieuwe groepen werden toegepast: vrouwen die zich in latere jaren in het hulpverleningsprogramma inschreven, vrouwen in een tweede ziekenhuis binnen hetzelfde netwerk en vrouwen met misbruikgerelateerde diagnoses die nooit in een gespecialiseerd programma waren opgenomen. In alle gevallen bleef het fusie-model boven een AUC van 0,8, wat suggereert dat het combineren van cijfers en tekst het systeem zowel nauwkeurig als stabiel maakt in verschillende omgevingen.

Patronen zien jaren voordat vrouwen hulp zoeken
Naast het onderscheiden van gevallen en controles herkenden de modellen vaak problemen lang voordat vrouwen misbruik aan specialisten disclosedden. Door de eerste datum waarop het model hoog risico aangaf te vergelijken met de datum waarop een vrouw het interventieprogramma betrad, vonden de onderzoekers gemiddelde “voortijdige waarschuwingsperioden” van meer dan drie jaar, met veel gevallen die vier of vijf jaar eerder werden gemarkeerd. Het gecombineerde model identificeerde een groter aandeel van toekomstige misbruikgevallen vroegtijdig, terwijl het uitsluitend-tabulaire model voor de gevallen die het wel detecteerde soms iets langere voorsprong gaf. Een analyse van de gestructureerde kenmerken benadrukte risicopatronen die overeenkomen met eerder klinisch onderzoek: frequente spoedbezoeken, bepaalde beeldvormende onderzoeken van de bovenste extremiteiten, veelgebruik van pijnmedicatie, geestelijke gezondheidsdiagnoses en signalen van sociale problemen waren allemaal gekoppeld aan een hoger voorspeld risico, terwijl routinematige preventiescreenings zoals mammogrammen doorgaans met een lager risico geassocieerd waren.
Risicoscores gebruiken zonder controle weg te nemen
De auteurs benadrukken dat deze hulpmiddelen niet bedoeld zijn om misbruik te “diagnosticeren” of de stem van een vrouw te overrulen. In plaats daarvan stellen ze zich voor dat de modellen stilletjes op de achtergrond van elektronische dossiersystemen draaien en zorgverleners een privé-risicoscore bieden die kan aanzetten tot zachte, trauma-geïnformeerde gesprekken en tijdige verwijzingen naar sociale en juridische hulp. Ze waarschuwen ook dat de data alleen vrouwen weerspiegelen van wie het misbruik werd gedocumenteerd of die hulp zochten, wat betekent dat sommige groepen ondervertegenwoordigd blijven. Voor brede uitrol moeten ziekenhuizen de prestaties in meer algemene populaties testen, monitoren op bias en zorgvuldige waarborgen ontwerpen zodat gemarkeerde scores leiden tot medelevende hulpaanbiedingen—en niet tot dwang of verlies van autonomie. Op deze manier gebruikt, zou multimodale machine learning alledaagse medische contacten kunnen veranderen in een eerder en betrouwbaarder toegangspunt tot veiligheid voor mensen die thuis geweld ervaren.
Bronvermelding: Gu, J., Carballo, K.V., Ma, Y. et al. Leveraging multimodal machine learning for accurate risk identification of intimate partner violence. npj Womens Health 4, 15 (2026). https://doi.org/10.1038/s44294-025-00126-3
Trefwoorden: intiem partnergeweld, elektronische medische dossiers, machine learning, multimodale gegevens, vroegtijdige risicodetectie