Clear Sky Science · es

Clasificación mediante aprendizaje automático de la mutilación genital femenina en 11 países del África subsahariana usando datos de encuestas demográficas y de salud

· Volver al índice

Por qué importa esta investigación

En partes de África y del mundo, millones de niñas siguen afrontando la mutilación genital femenina, una práctica profundamente dañina con consecuencias físicas y emocionales de por vida. Gobiernos y comunidades quieren acabar con ella, pero los recursos son limitados y puede resultar difícil obtener datos fiables sobre dónde las niñas están más en riesgo. Este estudio muestra cómo las herramientas modernas de detección de patrones, conocidas como aprendizaje automático, pueden examinar grandes encuestas de salud para destacar qué madres, familias y comunidades tienen más probabilidad de mantener la práctica y dónde los esfuerzos de prevención podrían salvar a más niñas del daño.

Comprender una práctica oculta

La mutilación genital femenina (MGF) implica lesionar intencionadamente o extirpar partes de los genitales externos femeninos por razones no médicas. Se reconoce como una violación de los derechos humanos y se asocia a problemas graves a corto plazo, como dolor, hemorragias abundantes, infección e incluso muerte, así como a complicaciones a largo plazo como dificultades en el parto, infertilidad y trauma psicológico. Aunque muchos países tienen leyes contra la MGF, sigue siendo común en partes del África subsahariana, donde la presión social, la tradición y las creencias sobre la religión y el matrimonio pueden prevalecer sobre las normas oficiales. Para diseñar programas de prevención más inteligentes, quienes toman decisiones necesitan herramientas que detecten patrones sobre quiénes están en mayor riesgo, más allá de los promedios nacionales simples.

Grandes datos procedentes de hogares cotidianos

Los investigadores se basaron en las Encuestas Demográficas y de Salud, grandes estudios representativos a nivel nacional que visitan miles de hogares para preguntar a las mujeres sobre sus vidas y su salud. Combinaron datos recientes de encuestas (2015–2023) de 62.249 mujeres en 11 países de África oriental y occidental. Todas tenían entre 15 y 49 años y al menos una hija. A cada madre se le preguntó si alguna de sus hijas había sido sometida a MGF. El equipo también recopiló información sobre la edad de la madre, si vivía en zona rural o urbana, su educación y riqueza del hogar, quién encabezaba el hogar, su propio estado respecto a la circuncisión, acceso a medios de comunicación, país de residencia y sus actitudes y creencias sobre la MGF, incluyendo si la consideraba requerida por su religión o si pensaba que debería continuar o detenerse. Estas múltiples piezas de información formaron la materia prima para los modelos informáticos que aprenderían a distinguir familias donde las hijas habían sido cortadas de aquellas donde no.

Figure 1
Figure 1.

Enseñar a las máquinas a reconocer el riesgo

Para convertir este conjunto de datos rico pero desordenado en algo que un ordenador pudiera aprender, el equipo limpió, estandarizó y codificó las respuestas para que tanto los números como las categorías fueran entendibles por los algoritmos. Utilizaron una técnica llamada SMOTE para asegurarse de que los modelos no aprendieran simplemente a favorecer al grupo mayoritario de familias donde las hijas no habían sido cortadas. A continuación probaron siete tipos diferentes de modelos de clasificación, incluyendo enfoques simples como la regresión logística y otros más flexibles como árboles de decisión, bosques aleatorios, máquinas de vectores de soporte, k‑vecinos más cercanos, Naive Bayes y XGBoost. Cada modelo se entrenó con el 80% de los datos y se evaluó con el 20% restante, usando varias métricas de rendimiento que miden con qué frecuencia el modelo acierta, qué tan bien evita pasar por alto casos verdaderos y cuán claramente separa a las familias de mayor riesgo de las de menor riesgo.

El modelo destacado y qué impulsa sus decisiones

Entre todos los enfoques probados, el modelo de bosque aleatorio —un método que combina muchos árboles de decisión en un único predictor más estable— fue el que mejor rendimiento ofreció. Clasificó correctamente a las madres en alrededor del 85% de los casos y fue especialmente eficaz para identificar a aquellas cuyas hijas habían sido sometidas a MGF, con una alta capacidad para distinguir niveles de riesgo en la población. Pero la precisión por sí sola no basta; los responsables de salud pública también necesitan comprender por qué el modelo hace sus predicciones. Para abrir esta caja negra, los autores usaron un método de interpretabilidad llamado SHAP, que asigna a cada factor una contribución a la decisión del modelo. Surgieron cuatro elementos clave: la opinión de la madre sobre si la MGF debe continuar, el país en el que vive, si ella misma ha sido sometida a MGF y si cree que la práctica es exigida por la religión. Las madres que apoyaban la continuidad de la MGF, vivían en países de alta prevalencia, habían sido circuncidadas ellas mismas o veían la MGF como una exigencia religiosa tenían mucha más probabilidad de informar que sus hijas habían sido cortadas.

Figure 2
Figure 2.

De los números a la acción

Estos hallazgos se traducen en orientaciones claras para quienes trabajan para acabar con la MGF. El modelo sugiere que cambiar las actitudes entre las madres —especialmente entre las que han sido cortadas y las que sienten presión religiosa para continuar la práctica— podría tener un efecto potente en la protección de las niñas. También pone de relieve que el riesgo varía considerablemente entre países, subrayando la necesidad de estrategias adaptadas a cada país en lugar de campañas uniformes. Si bien los autores advierten que sus datos transversales no pueden demostrar causa y efecto, y que cualquier clasificación de riesgo debe usarse con cuidado para evitar estigmatizar a comunidades, su trabajo muestra cómo el aprendizaje automático puede ayudar a localizar dónde la educación, la implicación comunitaria y el acercamiento basado en la fe son más urgentes. De este modo, las herramientas avanzadas de datos pueden convertirse en aliadas discretas pero importantes en el esfuerzo global por acabar con la MGF y salvaguardar la salud y los derechos de las niñas.

Cita: Gebrehana, A.K., Demoze, L., Yitageasu, G. et al. Machine learning based classification of female genital mutilation in 11 Sub-Saharan African countries using demographic and health survey data. Sci Rep 16, 9944 (2026). https://doi.org/10.1038/s41598-026-40723-z

Palabras clave: mutilación genital femenina, aprendizaje automático, África subsahariana, datos de salud pública, derechos de las mujeres