Clear Sky Science · pl

Wykorzystanie multimodalnego uczenia maszynowego do dokładnej identyfikacji ryzyka przemocy ze strony partnera

2026-03-13 · Powrót do spisu

Dlaczego ukryte sygnały ostrzegawcze mają znaczenie

Przemoc w związku często pozostaje w tajemnicy, nawet przed lekarzami, którzy widzą wywołane nią obrażenia. Tymczasem dokumentacja medyczna cicho przechowuje lata wskazówek: powtarzające się wizyty na izbie przyjęć, charakterystyczne wzorce urazów oraz notatki o bólu czy lęku. W tym badaniu pytano, czy komputery mogą odczytywać te wskazówki wcześniej i bardziej wiarygodnie niż dzisiejsze proste pytania przesiewowe, tak by kobiety zagrożone przemocą ze strony partnera mogły otrzymać pomoc znacznie wcześniej niż w kryzysowym momencie.

Przekształcanie codziennej opieki w system wczesnego ostrzegania

Naukowcy wykorzystali elektroniczne dokumenty medyczne z dwóch dużych amerykańskich szpitali, skupiając się na kobietach, które zapisały się do programu interwencyjnego dla ofiar przemocy domowej lub miały rozpoznania medyczne związane z przemocą ze strony partnera. Dla każdej z tych kobiet wybrano podobne pacjentki w tym samym przedziale wiekowym i o zbliżonym tle społecznym, które nie miały udokumentowanej przemocy, tworząc starannie dopasowaną grupę porównawczą. Od 2017 roku każde zetknięcie tych pacjentek z systemem szpitalnym dostarczało danych — rozpoznania, leki, badania obrazowe, parametry życiowe, wizyty na izbie przyjęć oraz notatki kliniczne, takie jak opisy radiologiczne czy podsumowania pracowników socjalnych.

Nauczanie komputerów czytania liczb i narracji

Zespół zbudował trzy typy modeli predykcyjnych, każdy przeznaczony do innego poziomu dostępności danych w realnych klinikach. Jeden model korzystał wyłącznie ze zorganizowanych informacji, takich jak kody rozpoznań, historia przepisywanych leków i liczba konkretnych badań obrazowych. Drugi model opierał się wyłącznie na tekstowych notatkach, które przekształcono w reprezentacje numeryczne przy użyciu współczesnych modeli języka medycznego trenowanych pierwotnie na milionach zdań klinicznych. Trzeci, „fusion” (połączony) model łączył oba źródła: wydobywał wzorce z zestawień tabelarycznych i z narracji, a następnie przekazywał scalone informacje do klasyfikatora uczenia maszynowego. Wszystkie modele były trenowane, by odpowiadać na codzienne pytanie przy każdej styczności z systemem: czy u tej pacjentki występują sygnały sugerujące, że może doświadczać przemocy ze strony partnera?

Jak dobrze działały sygnały ryzyka

Testowane na kobietach nieużytych w treningu, wszystkie trzy modele potrafiły z wysoką dokładnością odróżnić osoby z udokumentowaną przemocą od ich dopasowanych kontrolnych pacjentek. Wyniki podsumowano za pomocą miary AUC, gdzie 1,0 oznacza wynik idealny, a 0,5 — losowy. Model oparty tylko na danych tabelarycznych osiągnął AUC około 0,85, model oparty wyłącznie na notatkach — około 0,87, a połączony model fusion — około 0,88. Co istotne, te rezultaty utrzymywały się, gdy modele zastosowano do nowych grup: kobiet zapisujących się do programu interwencyjnego w późniejszych latach, pacjentek z drugiego szpitala w tej samej sieci oraz kobiet z rozpoznaniami związanymi z przemocą, które nigdy nie trafiły do specjalistycznego programu. We wszystkich przypadkach model fusion pozostawał powyżej AUC 0,8, co sugeruje, że łączenie danych liczbowych i tekstu czyni system zarówno dokładnym, jak i stabilnym w różnych warunkach.

Wykrywanie wzorców na lata przed zgłoszeniem się po pomoc

Ponadto modele często rozpoznawały problemy znacznie wcześniej, niż kobiety zgłaszały przemoc specjalistom. Porównując datę pierwszego wysokiego sygnału ryzyka z datą przyjęcia do programu interwencyjnego, badacze stwierdzili średnie „okresy wyprzedzenia” przekraczające trzy lata, przy czym wiele przypadków zostało wykrytych ponad cztery lub pięć lat wcześniej. Model połączony wychwytywał większy odsetek przyszłych przypadków przemocy we wczesnym stadium, podczas gdy model wyłącznie tabelaryczny czasem dawał nieco dłuższe ostrzeżenie dla tych przypadków, które wykrywał. Analiza cech strukturalnych uwypukliła wzorce ryzyka zgodne z wcześniejszymi badaniami klinicznymi: częste wizyty na izbie przyjęć, określone badania obrazowe kończyny górnej, duże zużycie leków przeciwbólowych, rozpoznania z obszaru zdrowia psychicznego oraz oznaki trudności społecznych były powiązane z wyższym przewidywanym ryzykiem, natomiast rutynowe badania przesiewowe, takie jak mammografia, zwykle wiązały się z niższym ryzykiem.

Korzystanie z ocen ryzyka bez odbierania kontroli

Autorzy podkreślają, że narzędzia te nie mają „diagnozować” przemocy ani zastępować głosu kobiety. Wyobrażają sobie raczej modele działające dyskretnie w tle systemów elektronicznej dokumentacji, dostarczające klinicystom prywatny wynik ryzyka, który może skłonić do delikatnej, opartej na zasadach leczenia traumy rozmowy i terminowych skierowań do wsparcia społecznego i prawnego. Ostrzegają też, że dane odzwierciedlają tylko kobiety, których przemoc została udokumentowana lub które szukały pomocy, co oznacza, że niektóre grupy pozostają niedostatecznie reprezentowane. Przed szerokim wdrożeniem szpitale będą musiały przetestować działanie w bardziej ogólnych populacjach, monitorować uprzedzenia oraz zaprojektować ostrożne zabezpieczenia, tak by wykryte wyniki prowadziły do współczujących ofert pomocy — a nie do nacisku czy utraty autonomii. Użyte w ten sposób, multimodalne uczenie maszynowe mogłoby przekształcić codzienne kontakty medyczne w wcześniejsze i bardziej wiarygodne bramy do bezpieczeństwa dla osób doświadczających przemocy w domu.

Cytowanie: Gu, J., Carballo, K.V., Ma, Y. et al. Leveraging multimodal machine learning for accurate risk identification of intimate partner violence. npj Womens Health 4, 15 (2026). https://doi.org/10.1038/s44294-025-00126-3

Słowa kluczowe: przemoc w związku, elektroniczne dokumenty medyczne, uczenie maszynowe, dane multimodalne