Clear Sky Science · pt

Aproveitando aprendizado de máquina multimodal para identificação precisa do risco de violência por parceiro íntimo

2026-03-13 · Voltar ao índice

Por que sinais de alerta ocultos importam

A violência em um relacionamento romântico costuma ser mantida em segredo, até mesmo dos médicos que veem as lesões que ela causa. Ainda assim, os prontuários médicos guardam silenciosamente anos de pistas: visitas repetidas ao pronto-socorro, determinados padrões de lesão e anotações sobre dor ou ansiedade. Este estudo investiga se os computadores podem ler essas pistas mais cedo e com mais confiabilidade do que as perguntas simples de triagem atuais, para que mulheres em risco de violência por parceiro íntimo possam receber ajuda muito antes de um ponto de crise.

Transformando o atendimento cotidiano em um sistema de alerta precoce

Os pesquisadores usaram prontuários eletrônicos de dois grandes hospitais dos EUA, concentrando-se em mulheres que haviam se inscrito em um programa de intervenção contra violência doméstica ou que tinham diagnósticos médicos relacionados à violência por parceiro íntimo. Para cada uma dessas mulheres, selecionaram pacientes semelhantes da mesma faixa etária e contexto geral que não tinham abuso documentado, criando um grupo de comparação cuidadosamente pareado. A partir de 2017, cada atendimento desses pacientes ao sistema hospitalar contribuiu com dados — diagnósticos, medicamentos, exames de imagem, sinais vitais, visitas de emergência e notas clínicas, como laudos de radiologia ou resumos de assistentes sociais.

Ensinando computadores a ler números e narrativas

A equipe construiu três tipos de modelos preditivos, cada um projetado para um nível diferente de riqueza de dados em clínicas do mundo real. Um modelo usou apenas informações estruturadas, como códigos de diagnóstico, histórico de prescrições e contagens de exames de imagem específicos. Um segundo modelo baseou-se somente nas notas em texto livre, que foram convertidas em representações numéricas usando modelos modernos de linguagem médica originalmente treinados em milhões de sentenças clínicas. O terceiro, um modelo de “fusão”, combinou ambas as fontes: destilou padrões das tabelas e das narrativas e então alimentou a informação mesclada em um classificador de aprendizado de máquina. Todos os modelos foram treinados para responder a uma pergunta diária durante cada contato hospitalar: esta paciente mostra sinais de que pode estar sofrendo violência por parceiro íntimo?

Quão bem os sinais de risco funcionaram

Quando testados em mulheres não usadas durante o treinamento, os três modelos foram capazes de separar aquelas com abuso conhecido de seus controles pareados com alta precisão. O desempenho é resumido por uma métrica chamada AUC, onde 1,0 é perfeito e 0,5 não é melhor que o acaso. O modelo apenas com dados tabulares alcançou AUC de cerca de 0,85, o modelo só com notas cerca de 0,87, e o modelo combinado de fusão cerca de 0,88. Crucialmente, esses resultados se mantiveram quando os modelos foram aplicados a novos grupos: mulheres que ingressaram no programa de intervenção em anos posteriores, mulheres em um segundo hospital da mesma rede e mulheres que tinham diagnósticos relacionados ao abuso mas nunca entraram em um programa especializado. Em todos os casos, o modelo de fusão permaneceu acima de AUC 0,8, sugerindo que misturar números e texto torna o sistema tanto preciso quanto estável entre diferentes cenários.

Vendo padrões anos antes de as mulheres pedirem ajuda

Além de distinguir casos de controles, os modelos frequentemente reconheceram problemas muito antes de as mulheres revelarem o abuso a especialistas. Ao comparar a primeira data em que o modelo sinalizou alto risco com a data em que a mulher entrou no programa de intervenção, os pesquisadores encontraram “tempos de antecedência” médios de mais de três anos, com muitos casos detectados com quatro ou cinco anos de antecedência. O modelo combinado identificou uma parcela maior de casos futuros de abuso precocemente, enquanto o modelo apenas tabular às vezes deu um aviso prévio um pouco maior para aqueles que detectou. Uma análise das características estruturadas destacou padrões de risco que se alinham com pesquisas clínicas anteriores: visitas frequentes ao pronto-socorro, certos exames de imagem dos membros superiores, alto uso de analgésicos, diagnósticos de saúde mental e sinais de dificuldades sociais estavam todos ligados a maior risco previsto, enquanto rastreamentos preventivos de rotina, como mamografias, tendiam a estar associados a menor risco.

Usando escores de risco sem retirar o controle

Os autores enfatizam que essas ferramentas não se destinam a “diagnosticar” abuso nem a suprimir a voz da mulher. Em vez disso, imaginam os modelos funcionando discretamente em segundo plano dos sistemas de prontuário eletrônico, oferecendo aos clínicos um escore de risco privado que pode motivar conversas delicadas, informadas por trauma, e encaminhamentos oportunos para apoio social e jurídico. Também alertam que os dados refletem apenas mulheres cujo abuso foi documentado ou que buscaram ajuda, o que significa que alguns grupos permanecem subrepresentados. Antes de uma implantação ampla, os hospitais precisarão testar o desempenho em populações mais gerais, monitorar vieses e desenhar salvaguardas cuidadosas para que escores sinalizados resultem em ofertas compassivas de ajuda — não em pressão ou perda de autonomia. Usado dessa forma, o aprendizado de máquina multimodal poderia transformar atendimentos médicos cotidianos em um portal mais precoce e confiável para a segurança de pessoas que enfrentam violência doméstica.

Citação: Gu, J., Carballo, K.V., Ma, Y. et al. Leveraging multimodal machine learning for accurate risk identification of intimate partner violence. npj Womens Health 4, 15 (2026). https://doi.org/10.1038/s44294-025-00126-3

Palavras-chave: violência por parceiro íntimo, prontuários eletrônicos, aprendizado de máquina, dados multimodais, detecção precoce de risco