Clear Sky Science · es

Construcción y validación de modelos de aprendizaje automático para predecir la perforación apendicular durante el tratamiento conservador de la apendicitis asociada a fecalito: un análisis multicéntrico retrospectivo con 20 algoritmos

· Volver al índice

Por qué importa para las personas con dolor abdominal

La apendicitis es una de las causas más frecuentes de cirugía de urgencia, pero hoy muchos pacientes reciben primero antibióticos en lugar de una operación inmediata. Para quienes tienen en el apéndice un tapón duro parecido a una piedra de heces, llamado fecalito, esta elección puede ser arriesgada porque el apéndice tiene más probabilidad de romperse. Este estudio plantea una pregunta relevante para cualquier paciente y médico ante esa decisión: ¿podemos, desde el inicio, identificar con seguridad quién puede seguir con medicación y quién corre un riesgo real de sufrir una perforación peligrosa?

Figure 1
Figure 1.

El reto de un apéndice obstruido

Los médicos saben desde hace años que la apendicitis se comporta de forma distinta cuando un fecalito obstruye el estrecho conducto del apéndice. La obstrucción eleva la presión, reduce el flujo sanguíneo y alimenta la infección, factores que aumentan la probabilidad de ruptura incluso si se inician antibióticos con rapidez. Sin embargo, los sistemas de puntuación habituales utilizados en la práctica clínica fueron diseñados para todos los pacientes, no específicamente para quienes tienen fecalitos, y no predicen bien la perforación en este grupo de mayor riesgo. Esa incertidumbre deja a los clínicos en la disyuntiva de operar con más frecuencia —con sus propios riesgos y costes— o esperar demasiado y enfrentarse a un apéndice reventado.

Usando patrones en los datos hospitalarios

Los investigadores recopilaron historias de 1.247 adultos tratados sin cirugía inmediata por apendicitis asociada a fecalito en cuatro hospitales grandes entre 2018 y 2023. Aproximadamente uno de cada siete sufrió una perforación en un plazo de tres días. Para cada paciente, el equipo recogió información simple que ya forma parte de la atención de rutina: edad, signos vitales, análisis de sangre que reflejan inflamación y medidas por TC del apéndice y del fecalito. Luego entrenaron 20 algoritmos informáticos distintos para detectar patrones que vincularan esas características con quién llegó o no a sufrir la rotura del apéndice, reservando parte de los datos para evaluar los modelos de forma justa.

La herramienta ganadora de predicción de riesgo

Entre todos los enfoques, una familia de métodos que combina muchos árboles de decisión, conocida como gradient boosting, fue la que mejor rendimiento mostró. Tras un paso de selección de variables, la herramienta final se basó en ocho datos fáciles de obtener, incluidos el tamaño del fecalito, los niveles sanguíneos de proteína C reactiva y de glóbulos blancos, y el grosor y el diámetro del apéndice en la TC. En el conjunto de prueba principal, el modelo separó correctamente a los pacientes de alto y bajo riesgo con una medida de precisión excelente (AUC alrededor de 0,89). Lo más llamativo fue que, cuando el modelo clasificó a alguien como de bajo riesgo, acertó en más del 96 por ciento de los casos en que no habría perforación, ofreciendo una fuerte tranquilidad para continuar con el tratamiento conservador.

Convertir números en grupos de riesgo claros

Para hacer la herramienta práctica en el cabezal de la cama, el equipo convirtió las puntuaciones de probabilidad crudas en tres niveles sencillos. Los pacientes con riesgo predicho por debajo del 30 por ciento se etiquetaron como de bajo riesgo y presentaron una tasa real de perforación del 3,8 por ciento. Los situados entre el 30 y el 60 por ciento fueron considerados de riesgo moderado, con aproximadamente uno de cada cuatro que llegó a perforar. Por encima del 60 por ciento estaban los pacientes de alto riesgo, más de siete de cada diez de los cuales terminaron perforando. Las acciones sugeridas siguen esta escala: vigilancia rutinaria para el grupo de bajo riesgo, observación más estrecha y pruebas repetidas para el grupo intermedio, y cirugía temprana o urgente para los pacientes con mayor riesgo. Un conjunto independiente de 225 pacientes procedente de un quinto hospital, no utilizado para entrenar el modelo, mostró un rendimiento muy similar, lo que sugiere que el enfoque puede funcionar más allá de los centros originales.

Figure 2
Figure 2.

Qué significa esto para pacientes y médicos

En términos prácticos, este estudio demuestra que un ordenador entrenado con pruebas de laboratorio ordinarias y hallazgos de TC puede ofrecer a los médicos una advertencia temprana mucho más clara sobre qué pacientes con un apéndice obstruido corren verdadero peligro si continúan solo con antibióticos. Aunque la herramienta no es perfecta, resulta especialmente eficaz para identificar a las personas que es seguro vigilar y tratar sin precipitar una intervención quirúrgica. Con más pruebas en distintos hospitales y su uso en tiempo real, estos modelos podrían respaldar decisiones más personalizadas, ayudando a muchos pacientes a evitar cirugías innecesarias y asegurando que quienes tienen mayor riesgo reciban operaciones oportunas antes de que el apéndice se rompa.

Cita: Zhu, Y., Feng, J., Liu, R. et al. Building and validating machine learning models to predict appendiceal perforation during conservative treatment of fecalith-associated appendicitis: a 20-algorithm multicenter retrospective analysis. Sci Rep 16, 11728 (2026). https://doi.org/10.1038/s41598-026-47372-2

Palabras clave: apendicitis, aprendizaje automático, predicción de riesgo, tratamiento conservador, gradient boosting