Clear Sky Science · es
Predicción basada en aprendizaje automático e identificación de determinantes del embarazo adolescente en diez países de África Oriental
Por qué importa este estudio
El embarazo adolescente condiciona la salud, la educación y los ingresos futuros de millones de jóvenes, especialmente en países de ingresos bajos y medios. En África Oriental, las niñas tienen mucha más probabilidad de quedar embarazadas en la adolescencia que en muchas otras regiones, con consecuencias que se extienden a familias y comunidades. Este estudio plantea una pregunta oportuna: ¿pueden las técnicas informáticas modernas —específicamente el aprendizaje automático— ayudarnos a identificar qué niñas corren mayor riesgo y qué condiciones sociales y económicas son más determinantes, de modo que los recursos limitados se destinen donde sean más efectivos?

Una nueva mirada con ordenadores inteligentes
Los investigadores analizaron datos de más de 32 000 niñas de 15 a 19 años en diez países de África Oriental, usando grandes encuestas sanitarias estandarizadas que ya orientan muchas decisiones de salud pública. En lugar de apoyarse solo en estadísticas tradicionales, recurrieron al aprendizaje automático supervisado, una familia de métodos que aprenden patrones a partir de ejemplos. Se probaron varios modelos, incluida la regresión logística, árboles de decisión y herramientas más avanzadas como Random Forests y XGBoost. Antes de entrenar estos modelos, el equipo limpió y preparó cuidadosamente los datos: completaron valores faltantes, convirtieron las respuestas de la encuesta a formatos adecuados para computación, escalaron las variables numéricas para que ningún factor dominara y crearon nuevas variables, como una medida combinada de acceso a radio, televisión y periódicos para representar la exposición a medios sociales.
Balancear los datos y entrenar los modelos
Un reto fue que la mayoría de las adolescentes encuestadas no habían estado embarazadas, lo que creó un desequilibrio entre casos “embarazadas” y “no embarazadas” que puede confundir a los algoritmos. Para afrontarlo, el equipo empleó técnicas que eliminan ejemplos duplicados en el límite y generan casos adicionales realistas para el grupo menor, produciendo un conjunto de datos más equilibrado e informativo. Luego dividieron los datos de modo que el 80 % se usara para entrenar los modelos y el 20 % restante para probar su rendimiento en niñas nuevas y no vistas. En varias medidas de evaluación —como la exactitud global, la sensibilidad para captar casos reales y la capacidad de evitar falsas alarmas— el modelo Random Forest destacó como el más fiable.

Qué impulsa el riesgo de embarazo adolescente
Con un modelo de buen rendimiento en mano, los autores se centraron en la interpretabilidad: ¿qué factores influyeron más en la predicción del embarazo adolescente? Usando selección de características y una herramienta de explicación llamada SHAP, identificaron de forma consistente un conjunto central de condiciones sociales y económicas. Entre ellas figuraban el no estar casada, iniciar la actividad sexual a edad temprana, bajos niveles de educación materna, vivir en hogares más pobres, tamaño familiar mayor, residencia en zonas rurales y declarar que la distancia a un centro de salud es un problema importante. La limitada exposición a medios sociales y fuentes digitales de información también pareció aumentar el riesgo. En contraste, el uso actual de métodos anticonceptivos modernos se asoció con una menor probabilidad de embarazo adolescente, lo que sugiere que el acceso y la aceptación de la anticoncepción pueden ser protectores.
Diferencias entre países y solidez del modelo
Los datos revelaron que el embarazo adolescente no se distribuye de forma homogénea en África Oriental. Kenia mostró la tasa más alta, alrededor de una de cada cinco adolescentes, mientras que Malawi presentó la tasa más baja en este conjunto de datos. Aun así, los mismos factores de riesgo generales aparecieron en la región. El modelo Random Forest capturó estos patrones con alta precisión (cercana al 90 %) y una fuerte capacidad para distinguir entre adolescentes de alto y bajo riesgo. Dado que el modelo fue probado repetidamente en distintos subconjuntos de los datos, los autores sostienen que su rendimiento probablemente se mantendrá en entornos reales similares, aunque el análisis no puede probar relaciones de causa y efecto.
Qué implica esto para las niñas y las comunidades
En términos sencillos, el estudio concluye que el embarazo adolescente en África Oriental está estrechamente vinculado a la pobreza, la escolarización limitada, el inicio temprano de la actividad sexual, la residencia rural, el pobre acceso a servicios de salud y la falta de información a través de medios modernos —mientras que la anticoncepción moderna ayuda a reducir el riesgo. Al mostrar que los modelos informáticos pueden detectar de forma fiable estos patrones en grandes encuestas nacionales, el trabajo sugiere una vía práctica: los gobiernos y organizaciones de salud podrían usar herramientas similares para identificar dónde son más vulnerables las adolescentes, ampliar los servicios de salud reproductiva amigables para jóvenes en zonas rurales, reforzar la educación sexual en las escuelas y aprovechar la radio, la televisión y los medios móviles para difundir información precisa y libre de estigmas. En conjunto, estas medidas podrían ayudar a más adolescentes a evitar embarazos no deseados y a conservar el control sobre su salud y su futuro.
Cita: Baykemagn, N.D., Gebiru, A.M., Getnet, M. et al. Machine learning-based prediction and identification of determinants of teenage pregnancy in ten East African countries. Sci Rep 16, 13128 (2026). https://doi.org/10.1038/s41598-026-43004-x
Palabras clave: embarazo adolescente, África Oriental, aprendizaje automático, salud reproductiva, determinantes sociales