Clear Sky Science · es
Predicción de supervivencia cruzada entre cánceres usando modelos de aprendizaje automático
Por qué importa predecir la supervivencia del cáncer de nuevas maneras
Los pacientes con cáncer y sus familias a menudo plantean una pregunta simple pero angustiosa: “¿Cuánto tiempo me queda?” Los médicos intentan responder basándose en su experiencia y datos previos, pero para muchos cánceres raros simplemente no hay casos similares suficientes que permitan predicciones precisas. Este estudio explora si programas informáticos modernos pueden “tomar prestada la experiencia” de cánceres comunes para ayudar a pronosticar la supervivencia en los menos frecuentes, potencialmente proporcionando a más pacientes expectativas más claras y cuidados mejor adaptados. 
Usar pacientes pasados para orientar la atención futura
Los investigadores trabajaron con un gran conjunto de información del mundo real procedente de registros hospitalarios de cáncer en São Paulo, Brasil. Estos registros abarcan a más de un millón de pacientes tratados entre 2000 y 2019 e incluyen detalles como edad, estadio tumoral, tratamientos recibidos y si la persona seguía con vida tres años después del diagnóstico. Centrar el análisis en ese punto de los tres años permitió al equipo comparar cánceres con expectativas de vida muy distintas evitando datos muy desbalanceados, en los que casi todo el mundo sobrevive o fallece.
Enseñar a las máquinas a detectar patrones de supervivencia
Para convertir este registro en una herramienta de predicción, los autores utilizaron dos métodos populares de aprendizaje automático, XGBoost y LightGBM. Estos métodos no intentan comprender la biología directamente; en su lugar, examinan miles de historias clínicas para encontrar patrones que relacionen características como el estadio de la enfermedad y el momento del tratamiento con la supervivencia posterior. Primero, el equipo construyó modelos “especialistas”, cada uno entrenado solo con un tipo de cáncer, como mama, pulmón o estómago. Luego comprobaron qué tan bien estos modelos podían predecir la supervivencia a tres años en nuevos pacientes con el mismo cáncer, usando medidas estándar que equilibran la identificación correcta de sobrevivientes y no sobrevivientes.
¿Puede un cáncer ayudar a predecir otro?
El núcleo del estudio plantea una pregunta audaz: ¿puede un modelo entrenado en un tipo de cáncer predecir con éxito la supervivencia en otro cáncer distinto? Para probarlo, los investigadores agruparon los cánceres de dos maneras: los cánceres más comunes (piel, mama, próstata, colorrectal, pulmón y cérvix) y los cánceres del sistema digestivo (cavidad oral, orofaringe, esófago, estómago, intestino delgado, colorrectal y ano). En una primera fase, entrenaron modelos separados para cada cáncer y los probaron en los demás, seleccionando solo los emparejamientos donde tanto supervivencia como no supervivencia se predecían con un equilibrio razonable. En fases posteriores, fusionaron datos de cánceres seleccionados en conjuntos de entrenamiento compartidos, creando modelos más generales que aprovechaban patrones entre tumores relacionados. 
Dónde ayuda el aprendizaje entre cánceres — y dónde no
Para los cánceres comunes, combinar datos entre tipos no superó a los mejores modelos especialistas. Un único modelo entrenado con los seis cánceres comunes, por ejemplo, predijo con menos precisión que los modelos adaptados a cada cáncer por separado. La historia fue diferente para algunos cánceres del sistema digestivo. Cuando se agruparon datos de cánceres de cavidad oral, esófago y estómago, el modelo resultante predijo la supervivencia a tres años del cáncer de estómago ligeramente mejor que el modelo exclusivo para estómago, con una precisión balanceada algo por encima del 80 por ciento. Sin embargo, pruebas estadísticas mostraron que esta mejora no era claramente distinta del azar, lo que significa que el modelo compartido y el especialista estaban esencialmente empatados. Resultados similares de “casi pero no del todo mejor” aparecieron para cánceres de cavidad oral, intestino delgado y colorrectal, con frecuencia implicando compensaciones entre identificar correctamente a sobrevivientes frente a no sobrevivientes.
Qué significa esto para pacientes con cánceres raros
Aunque los modelos entre cánceres rara vez superaron a los mejores modelos específicos de enfermedad, a menudo se acercaron bastante — usando únicamente información tomada de otros tipos de cáncer. Para los cánceres raros que carecen de grandes conjuntos de datos de alta calidad, esto es una señal alentadora: en el futuro, los médicos podrían apoyarse en modelos entrenados con cánceres más comunes para ofrecer estimaciones de supervivencia útiles cuando sea imposible construir herramientas especialistas. Los autores advierten que estos métodos no están listos para el uso clínico rutinario y que deben probarse en otras regiones y combinarse con datos biológicos más profundos. Aun así, el trabajo apunta a un futuro en el que ningún paciente se quede sin orientación simplemente porque su cáncer sea poco común.
Cita: Cardoso, L.B., Egydio, J.E., Toporcov, T.N. et al. Cross-cancer survival prediction using machine learning models. Sci Rep 16, 9623 (2026). https://doi.org/10.1038/s41598-025-34133-w
Palabras clave: predicción de supervivencia del cáncer, aprendizaje automático en oncología, modelado entre cánceres, cánceres raros, registros clínicos