Clear Sky Science · pt

Classificação baseada em aprendizado de máquina da mutilação genital feminina em 11 países da África Subsaariana usando dados de pesquisas demográficas e de saúde

2026-02-19 · Voltar ao índice

Por que essa pesquisa importa

Em partes da África e do mundo, milhões de meninas ainda enfrentam a mutilação genital feminina, uma prática profundamente prejudicial com consequências físicas e emocionais ao longo da vida. Governos e comunidades querem detê‑la, mas os recursos são limitados e dados confiáveis sobre onde as meninas estão mais em risco podem ser difíceis de obter. Este estudo mostra como ferramentas modernas de descoberta de padrões, conhecidas como aprendizado de máquina, podem vasculhar grandes pesquisas de saúde para destacar quais mães, famílias e comunidades têm maior probabilidade de manter a prática — e onde esforços de prevenção poderiam salvar mais meninas do dano.

Compreendendo uma prática oculta

A mutilação genital feminina (MGF) envolve ferir intencionalmente ou remover partes dos genitais externos femininos por motivos não médicos. É reconhecida como uma violação dos direitos humanos e está associada a problemas graves de curto prazo, como dor, sangramento intenso, infecção e até morte, além de complicações de longo prazo, como dificuldades no parto, infertilidade e trauma psicológico. Embora muitos países tenham leis contra a MGF, ela permanece comum em partes da África Subsaariana, onde a pressão social, a tradição e crenças sobre religião e casamento podem se sobrepor às regras oficiais. Para projetar programas de prevenção mais inteligentes, os tomadores de decisão precisam de ferramentas que identifiquem padrões sobre quem está mais em risco, indo além de médias nacionais simples.

Big data de lares comuns

Os pesquisadores usaram as Pesquisas Demográficas e de Saúde, grandes estudos nacionalmente representativos que visitam milhares de domicílios para perguntar às mulheres sobre suas vidas e saúde. Eles combinaram dados de pesquisa recentes (2015–2023) de 62.249 mulheres em 11 países do Leste e Oeste da África. Todas tinham entre 15 e 49 anos e ao menos uma filha. Cada mãe foi questionada se alguma de suas filhas havia sido submetida à MGF. A equipe também reuniu informações sobre a idade da mãe, se vivia em área rural ou urbana, sua educação e riqueza domiciliar, quem chefiava o domicílio, seu próprio status de circuncisão, acesso a mídia, país de residência e suas atitudes e crenças sobre a MGF, incluindo se a via como exigida por sua religião ou se achava que deveria continuar ou parar. Essas várias peças de informação formaram a matéria‑prima para modelos computacionais que aprenderiam a distinguir famílias cujas filhas foram cortadas daquelas cujas filhas não foram.

Ensinando máquinas a reconhecer o risco

Para transformar esse conjunto de dados rico, porém desorganizado, em algo que um computador pudesse aprender, a equipe limpou, padronizou e codificou as respostas para que tanto números quanto categorias fossem compreendidos por algoritmos. Usaram uma técnica chamada SMOTE para garantir que os modelos não aprendessem simplesmente a favorecer o grupo maior de famílias cujas filhas não foram cortadas. Em seguida, testaram sete tipos diferentes de modelos de classificação, incluindo abordagens simples como regressão logística e outras mais flexíveis, como árvores de decisão, florestas aleatórias, máquinas de vetores de suporte, k‑nearest neighbors, Naive Bayes e XGBoost. Cada modelo foi treinado em 80% dos dados e avaliado nos 20% restantes, usando várias métricas de desempenho que medem com que frequência o modelo acerta, quão bem evita perder casos verdadeiros e quão claramente separa famílias de maior risco das de menor risco.

O modelo de destaque e o que orienta suas escolhas

Entre todas as abordagens testadas, o modelo de floresta aleatória — um método que combina muitas árvores de decisão em um único preditor mais estável — foi o que apresentou melhor desempenho. Classificou corretamente as mães em cerca de 85% dos casos e foi especialmente eficaz em identificar aquelas cujas filhas foram submetidas à MGF, com alta capacidade de distinguir níveis de risco na população. Mas a precisão por si só não é suficiente; profissionais de saúde pública também precisam entender por que o modelo faz suas previsões. Para abrir essa caixa‑preta, os autores usaram um método de interpretabilidade chamado SHAP, que atribui a cada fator uma contribuição para a decisão do modelo. Quatro elementos se destacaram: a opinião da mãe sobre se a MGF deveria continuar, o país em que ela vive, se ela própria foi submetida à MGF e se acredita que a prática é exigida pela religião. Mães que apoiavam a continuação da MGF, viviam em países de alta prevalência, eram elas mesmas circuncidadas ou viam a MGF como exigida pela religião eram muito mais propensas a relatar que suas filhas haviam sido cortadas.

Dos números à ação

Esses achados se traduzem em orientações claras para quem trabalha para acabar com a MGF. O modelo sugere que mudar atitudes entre as mães — especialmente aquelas que foram cortadas e as que sentem pressão religiosa para manter a prática — pode ter efeito poderoso na proteção das meninas. Também destaca que o risco difere fortemente entre países, sublinhando a necessidade de estratégias adaptadas a cada país, em vez de campanhas uniformes. Embora os autores alertem que seus dados transversais não podem provar causa e efeito, e que quaisquer classificações de risco devem ser usadas com cuidado para evitar estigmatizar comunidades, o trabalho mostra como o aprendizado de máquina pode ajudar a localizar onde educação, engajamento comunitário e ações baseadas na fé são mais urgentemente necessárias. Dessa forma, ferramentas avançadas de dados podem se tornar aliadas discretas, porém importantes, no esforço global para acabar com a MGF e proteger a saúde e os direitos das meninas.

Citação: Gebrehana, A.K., Demoze, L., Yitageasu, G. et al. Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data. Sci Rep 16, 9944 (2026). https://doi.org/10.1038/s41598-026-40723-z

Palavras-chave: mutilação genital feminina, aprendizado de máquina, África Subsaariana, dados de saúde pública, direitos das mulheres