Clear Sky Science · es
Evaluación de modelos de aprendizaje profundo para la predicción de sepsis en UCI frente a cambios en la distribución: un estudio de cohorte retrospectivo multicéntrico
Por qué importa la alerta temprana frente a la infección
La sepsis es una reacción rápida y potencialmente letal ante una infección y una de las principales causas de muerte en unidades de cuidados intensivos. Los hospitales recurren a la inteligencia artificial para detectar señales sutiles en monitores y pruebas de laboratorio horas antes de que la sepsis sea evidente para los médicos. Pero hay una complicación: un algoritmo que funciona bien en un hospital a menudo falla en otro, porque los pacientes, el equipo y el registro de datos varían según el lugar. Este estudio plantea una pregunta práctica para la atención real: dadas esas diferencias, ¿cuál es la forma más inteligente de reutilizar o adaptar un modelo de predicción de sepsis cuando se traslada a una UCI nueva?
Cómo los datos hospitalarios pueden cambiar sin que lo notemos
Los investigadores empezaron mostrando cuán distintos pueden ser los datos de cuidados intensivos entre hospitales. Compararon tres grandes bases de datos de UCI de Estados Unidos y Suiza, todas armonizadas cuidadosamente para registrar las mismas constantes vitales y resultados de laboratorio a lo largo del tiempo. Incluso después de esa armonización, muchas de las 48 señales medidas —como la presión arterial, los niveles de oxígeno y ciertos recuentos sanguíneos— mostraron patrones claramente diferentes entre centros. Pruebas estadísticas revelaron que en cada par de hospitales, decenas de variables seguían distribuciones distintas, y algunas características se comportaban de forma única en cada conjunto de datos. En términos generales, los dos conjuntos de datos estadounidenses se parecían más entre sí que a la base suiza, lo que subraya que las prácticas nacionales y los hábitos de medición imprimen una huella en los datos que los algoritmos deben interpretar.

Probar la IA en múltiples unidades de cuidados intensivos
Con esas diferencias establecidas, el equipo entrenó tres tipos de modelos de aprendizaje profundo para predecir sepsis alrededor de seis horas antes de su diagnóstico formal. A continuación, evaluaron qué ocurre cuando se usa directamente en otra UCI un modelo entrenado en un hospital distinto. En general, los modelos se transfirieron razonablemente bien, especialmente cuando la UCI de destino disponía de muy pocos datos propios. Por ejemplo, cuando sólo había una pequeña fracción de registros locales, usar un modelo preentrenado en otro centro superó a entrenar un modelo nuevo desde cero. Las redes neuronales convolucionales fueron las más estables entre sitios. A medida que se añadieron más datos locales, el rendimiento aumentó de forma constante y finalmente se estabilizó, siendo algunos hospitales (en particular el gran conjunto multicéntrico estadounidense) más fáciles de modelar que otros.
Probando distintas maneras de trasladar un modelo
Después, los autores compararon estrategias prácticas para desplegar estos modelos cuando un hospital va acumulando gradualmente sus propios datos. Examinaron cinco opciones: reutilizar el modelo original tal cual; afinar sólo sus últimas capas; volver a entrenar completamente todas sus capas con datos locales; entrenar un modelo completamente nuevo sólo con datos locales; y dos formas de "adaptación de dominio" que buscan explícitamente alinear las características internas del modelo entre hospitales origen y destino. Agruparon a los hospitales de destino según regímenes de datos pequeños, medianos y grandes y repitieron la comparación entre varios pares origen–destino y tipos de modelos. Este enfoque sistemático imitó despliegues del mundo real, desde una UCI rural pequeña con unos pocos casos hasta una red nacional que agrupa decenas de miles de estancias.

Qué funciona mejor según la escala de datos
Los resultados cuestionan la práctica habitual de confiar en el ajuste fino simple. En muchas condiciones, el ajuste fino quedó por detrás de otros métodos. Cuando la UCI de destino tenía sólo un número reducido de casos, la mejor opción fue inicializar con el modelo externo y luego volver a entrenar todas sus capas con los datos locales; la fusión de datos fuente y destino en un único conjunto de entrenamiento quedó en un cercano segundo lugar. Para conjuntos de tamaño medio, los métodos de adaptación de dominio —técnicas que ajustan el modelo para que los patrones de características de ambos hospitales se solapen más— ofrecieron las ganancias más fiables, mejorando métricas de discriminación y manteniendo baja la variabilidad. Una vez que la UCI de destino acumuló un gran conjunto de datos, los modelos entrenados total o mayoritariamente con esos datos locales, a veces con fusión adicional, igualaron o superaron a todos los enfoques basados en transferencia.
Qué significa esto para la atención al paciente
Para no especialistas, el mensaje clave es que no existe una única forma de desplegar IA para la sepsis en todos los hospitales. Debido a que cada UCI tiene su propia "acento de datos", importar simplemente un modelo y ajustar su capa final —un atajo común— puede dejar rendimiento sobre la mesa o incluso inducir a error a los clínicos. En cambio, el estudio sugiere una guía práctica: en entornos con muy pocos datos, partir de un modelo externo y volver a entrenarlo a fondo; a medida que se acumulen más casos locales, pasar a un entrenamiento consciente del dominio que respete las diferencias entre hospitales; y cuando existan grandes conjuntos de datos locales, priorizar modelos construidos principalmente con esa experiencia local. Seguir estos principios puede ayudar a los hospitales a poner en marcha herramientas de predicción de sepsis antes, manteniendo sus alertas más fiables y mejor adaptadas a sus propios pacientes.
Cita: Tranchellini, F., Farag, Y., Jutzeler, C. et al. Evaluating deep learning sepsis prediction models in ICUs under distribution shift: a multi-centre retrospective cohort study. npj Digit. Med. 9, 306 (2026). https://doi.org/10.1038/s41746-026-02364-4
Palabras clave: predicción de sepsis, cuidados intensivos, aprendizaje profundo, adaptación de dominio, cambio en la distribución