Clear Sky Science · es
Enfoques de aprendizaje automático para predecir el riesgo de tuberculosis entre los contactos domésticos de pacientes índice con TB en el centro de Etiopía
Por qué esto importa para las familias
La tuberculosis (TB) suele asociarse a contagios en autobuses o mercados concurridos, pero muchas infecciones ocurren en el hogar. Cuando una persona del hogar tiene TB, sus familiares comparten el aire, las habitaciones y las camas, y aun así solo unos pocos llegarán a desarrollar la enfermedad. Este estudio del centro de Etiopía plantea una pregunta práctica con relevancia global: ¿pueden los ordenadores ayudarnos a identificar rápidamente qué miembros de la familia tienen más probabilidades de enfermar, para que las pruebas y los medicamentos escasos se usen donde más se necesitan?
La vida dentro de las viviendas estudiadas
Los investigadores trabajaron con equipos de salud que visitan de forma rutinaria los hogares de personas diagnosticadas con TB pulmonar infecciosa. En cuatro distritos rurales y tres pequeñas localidades, recogieron información detallada sobre 387 pacientes "índice" y 1.277 personas que vivían con ellos. Muchas viviendas estaban hacinadas; una familia típica de cuatro miembros vivía en casas pequeñas que a menudo tenían solo una habitación y una ventana. La mayoría cocinaba con leña o carbón, llenando el aire de humo. Muchos convivientes eran niños o adultos jóvenes, y casi la mitad tanto de los pacientes como de los contactos tenía poca o ninguna educación formal. Estos son entornos donde la TB se transmite con facilidad, pero aun así solo 23 convivientes (aproximadamente 2 de cada 100) fueron finalmente diagnosticados con TB.

Convertir las visitas domiciliarias en datos
Cada visita domiciliaria generó una imagen rica de la vida cotidiana y de la salud. Para cada contacto, el equipo registró edad, sexo, estado de vacunación, tos, fiebre, sudores nocturnos, cansancio, pérdida de peso, tiempo pasado con el paciente y otras enfermedades como asma o diabetes. También anotaron detalles del hogar, como número de habitaciones, tipo de vivienda, combustible para cocinar y ventilación, junto con características del paciente índice, por ejemplo cuánto tiempo había estado enfermo antes de iniciar el tratamiento. Toda esta información se transformó en números aptos para el análisis por ordenador, con métodos cuidadosos para manejar respuestas faltantes y para evitar que eventos raros —como el pequeño número de casos de TB en el conjunto de datos— fueran ignorados por los modelos.
Dejar que los algoritmos busquen patrones
El equipo entrenó varios tipos de modelos de aprendizaje automático —programas informáticos que aprenden patrones a partir de datos— para adivinar qué contactos tenían TB. Entre ellos incluyeron herramientas estadísticas conocidas, como la regresión logística, y enfoques más flexibles como Random Forests, Balanced Random Forests, K‑Nearest Neighbors, redes neuronales artificiales y gradient boosting. Dado que la gran mayoría de los contactos no tenía TB, los autores se centraron en la "recuperación" (recall): la capacidad de un modelo para detectar tantos casos verdaderos de TB como sea posible, incluso si eso implicaba generar algunas falsas alarmas. En salud pública, pasar por alto a una persona enferma suele ser más peligroso que analizar a una sana de más.

Qué impulsó el riesgo y qué modelos funcionaron mejor
Los modelos ensamblados que combinan muchas reglas de decisión simples, en particular Random Forest y su variante "balanceada", fueron los que mejor identificaron los casos verdaderos de TB. Identificaron correctamente alrededor de seis de cada siete personas con TB, manteniendo una precisión global razonable. El estudio también empleó una técnica denominada SHAP para asomarse dentro de estas cajas negras y ver qué factores tenían mayor peso. Haber sido señalado como caso presuntivo de TB durante el cribado, entregar una muestra de esputo, tener una tos de larga duración o con flema, sentirse muy cansado y pérdida de apetito empujaron con fuerza a un contacto hacia el lado de "probable TB". Entre las características del hogar, una menor superficie de la vivienda (un signo de hacinamiento) aumentó el riesgo. Algunas características parecieron protectoras: ser mujer, ser más alto y convivir con un paciente índice con mayor nivel educativo se asociaron con menor riesgo, posiblemente reflejando diferencias en la exposición, la nutrición y el acceso a la atención.
Qué significa esto para el control de la TB
Para los programas de salud que deben estirar recursos limitados, los hallazgos ofrecen una forma de usar los datos de las visitas domiciliarias rutinarias de manera más inteligente. En lugar de tratar a todos los contactos domésticos por igual, las clínicas podrían ejecutar modelos informáticos sencillos en segundo plano para señalar a quienes tienen mayor riesgo y así priorizar seguimiento más estrecho, pruebas más rápidas o tratamiento preventivo. El estudio sugiere que incluso en entornos con pocos recursos, herramientas de aprendizaje automático diseñadas con cuidado pueden apoyar una detección más temprana de la TB entre los familiares, reducir casos no detectados y hacer las investigaciones de contactos más eficientes —siempre que los modelos se prueben y adapten en otras regiones antes de integrarlos en las estrategias nacionales contra la TB.
Cita: Wolde, H.M., Kebede, W., Yewhalaw, D. et al. Machine learning approaches to predict the risk of tuberculosis among household contacts of index TB patients in Central Ethiopia. Sci Rep 16, 10457 (2026). https://doi.org/10.1038/s41598-026-41547-7
Palabras clave: tuberculosis, contactos domésticos, aprendizaje automático, predicción de riesgo, Etiopía