Clear Sky Science · es

Un marco de inteligencia artificial explicable para la predicción de la enfermedad cardíaca isquémica usando selección de características mejorada con búsqueda de ardillas voladoras

2026-04-01 · Volver al índice

Por qué importan controles cardíacos más inteligentes

La enfermedad cardíaca sigue siendo la principal causa de muerte en el mundo, pero los médicos a menudo deben equilibrar el tiempo limitado, numerosos resultados de pruebas y herramientas informáticas complejas. Este estudio muestra cómo un sistema de inteligencia artificial fácil de explicar puede ayudar a los médicos a detectar la enfermedad cardíaca isquémica de forma temprana manteniendo su razonamiento claro. En lugar de ocultar sus decisiones en una caja negra, el sistema destaca qué pocas mediciones de pruebas son las más importantes, ayudando a los clínicos a usar el soporte informático sin perder confianza ni control.

Figure 1. Un sistema de IA que, usando pruebas médicas clave, ayuda a los médicos a evaluar rápidamente el riesgo de enfermedad cardíaca de un paciente.

Problemas cardíacos y los datos que los respaldan

La enfermedad cardíaca isquémica se produce cuando el flujo sanguíneo al corazón se reduce, a menudo por arterias obstruidas. Los médicos analizan muchos datos, como la edad, la presión arterial, el colesterol, el dolor torácico y los resultados de exploraciones cardíacas. El conjunto de datos UCI Heart Disease utilizado en este trabajo recopila 303 registros de pacientes con 13 de estos factores además de una etiqueta que indica la presencia o ausencia de la enfermedad. Aunque esta riqueza ayuda a la predicción, demasiadas mediciones superpuestas o poco útiles pueden confundir tanto a humanos como a máquinas, ralentizar el análisis y a veces reducir la precisión.

Limpiar y reducir el historial médico

Antes de que un ordenador pueda aprender de los datos, los registros en bruto deben limpiarse y reorganizarse. Los investigadores completaron los números faltantes usando un método que toma información de pacientes similares, escalaron todas las mediciones a un rango común, convirtieron categorías tipo texto —como el tipo de dolor torácico— en forma numérica y revisaron cuidadosamente valores inusuales para separar casos extremos reales de probables errores. También equilibraron el número de pacientes enfermos y sanos generando ejemplos adicionales realistas del grupo minoritario, y eliminaron características que eran casi duplicados entre sí. El resultado es una tabla ordenada donde cada columna es significativa y está lista para el análisis.

Cómo las ardillas voladoras inspiran la selección de características

La idea central del estudio es que el ordenador no necesita todas las mediciones disponibles para hacer buenas predicciones. En su lugar, debe buscar automáticamente un pequeño conjunto de las más informativas. Para ello, los autores usan un método de optimización inspirado en cómo las ardillas voladoras buscan alimento en un bosque. En su procedimiento de Optimización Mejorada por Búsqueda de Ardillas, cada “ardilla” representa un posible subconjunto de características, y el grupo planea colectivamente a través del espacio de búsqueda, ajustando sus movimientos cuando el progreso se estanca. Las combinaciones de mejor rendimiento se conservan y refinan, buscando el grupo más pequeño de mediciones que aún permita decisiones altamente precisas.

Figure 2. Mediciones seleccionadas de pruebas cardíacas se procesan mediante un modelo explicable para clasificar a los pacientes en grupos sanos y en riesgo.

Entrenar el modelo y abrir la caja negra

Una vez que la búsqueda inspirada en ardillas selecciona un subconjunto óptimo de características, se entrena un modelo Random Forest para predecir quién padece enfermedad cardíaca. Random Forest utiliza muchos árboles de decisión ligeramente diferentes cuyas votaciones se combinan, lo que hace que la predicción final sea robusta frente al ruido en los datos. Con las características elegidas, el modelo alcanza aproximadamente entre un 96 y un 98 por ciento de precisión y una puntuación muy alta para distinguir entre pacientes enfermos y sanos. Para hacer su lógica comprensible, los investigadores aplican luego dos herramientas de explicación. Una, llamada SHAP, muestra qué factores son más influyentes en todo el conjunto de datos, mientras que la otra, LIME, se centra en pacientes individuales para mostrar cómo sus valores específicos empujan la predicción hacia un mayor o menor riesgo.

Qué significa esto para pacientes y médicos

En términos sencillos, el estudio construye un ayudante de predicción de enfermedad cardíaca que es a la vez preciso y comunicativo. Al reducir la entrada a unas pocas mediciones clave y luego usar explicaciones visuales claras, el sistema puede decirle al clínico no solo que un paciente probablemente tiene enfermedad cardíaca isquémica, sino también qué hallazgos, como cierto resultado de una exploración o un nivel de cambio relacionado con el ejercicio, están impulsando esa conclusión. Este equilibrio de precisión, simplicidad y claridad hace que el enfoque sea más adecuado para clínicas reales, y podría extenderse en el futuro a hospitales más grandes y fuentes de datos más ricas como dispositivos wearables y exámenes de imagen.

Cita: Cenitta, D., Arul, N., Arjunan, R.V. et al. An explainable artificial intelligence framework for ischemic heart disease prediction using enhanced squirrel search feature selection. Sci Rep 16, 15422 (2026). https://doi.org/10.1038/s41598-026-46823-0

Palabras clave: enfermedad cardíaca isquémica, IA explicable, predicción de enfermedad cardíaca, selección de características, random forest