Clear Sky Science · es

Un conjunto de datos de TC con medidas RECIST y máscaras de segmentación exhaustivas para tumores y ganglios linfáticos

· Volver al índice

Por qué importa este recurso de imagenología oncológica

La atención del cáncer depende cada vez más de las imágenes médicas para determinar si los tratamientos están funcionando. Sin embargo, las mediciones cuidadosas, corte por corte, que realizan los médicos en las TC consumen mucho tiempo y pueden variar entre expertos. Este artículo presenta una nueva colección de TC de acceso abierto de pacientes oncológicos, con tumores y ganglios linfáticos minuciosamente delineados y medidos según un manual clínico de uso extendido. Está diseñada para ayudar a los investigadores a crear y evaluar programas informáticos que, en el futuro, podrían asumir gran parte de este trabajo tedioso y hacer que el seguimiento del tratamiento del cáncer sea más rápido y consistente a nivel mundial.

Cómo rastrean actualmente los médicos los tumores

Para juzgar si un tratamiento contra el cáncer está ayudando, los radiólogos suelen seguir una norma llamada RECIST 1.1. En la práctica, eso significa que eligen un puñado de tumores “objetivo” en las TC del paciente y registran el diámetro visible más largo de cada uno en milímetros. Con el tiempo, comparan la suma de estos diámetros con exploraciones anteriores para decidir si la enfermedad ha disminuido, se ha mantenido estable o ha crecido. Aunque este enfoque ha aportado el orden necesario a los ensayos clínicos, también tiene inconvenientes: depende en gran medida de qué tumores elige el médico, se basa en mediciones unidimensionales en lugar del tamaño real 3-D y, por lo general, lleva más de 10 minutos por paciente y evaluación. A medida que aumentan los casos de cáncer en todo el mundo, estos límites ejercen una presión real sobre los servicios de radiología.

Figure 1
Figura 1.

Qué contiene el nuevo conjunto de datos de TC

Los autores reunieron TC de 22 adultos tratados por diversos tipos de cáncer en el Hospital Clínico de la Universidad de Chile, incluidos cánceres de pulmón, hígado, colorrectal, mama, ovario, estómago, vesícula biliar, vejiga y melanoma. A partir de 58 series de exploraciones torácicas y abdominales realizadas entre 2017 y 2023, identificaron cada tumor sólido o ganglio linfático agrandado lo bastante grande para medirse. En total, contornearon manualmente 1.246 lesiones individuales: 1.148 metástasis (tumores que se han diseminado), 93 ganglios linfáticos agrandados y 5 tumores primarios. Para 82 de estas lesiones, también incluyeron las mediciones RECIST oficiales registradas en los informes clínicos, lo que permite una comparación directa entre la práctica rutinaria y los métodos automatizados.

Cómo trabajaron expertos e IA en conjunto

Producir contornos tan detallados sería normalmente excesivamente lento, por lo que el equipo utilizó una estrategia de «humano en el circuito». Radiólogos experimentados y residentes dibujaron cajas 3-D aproximadas alrededor de los tumores sospechosos, y un potente modelo de segmentación llamado MedSAM propuso bordes iniciales. Los residentes corrigieron luego esos bordes y los radiólogos sénior realizaron una revisión final. Tras cada lote de exploraciones completado, el modelo de IA se volvió a entrenar con los contornos mejorados y se utilizó para ayudar con el siguiente lote. Con cada ciclo, su rendimiento se acercó más a lo aceptable para expertos humanos, reduciendo el esfuerzo necesario para correcciones posteriores sin sacrificar precisión.

Qué revelan los datos sobre los tumores

Dado que cada lesión en las exploraciones fue delineada en tres dimensiones, los autores pudieron estudiar con detalle sus tamaños y densidades. La mayoría de los tumores estaban en los pulmones y el hígado. Los tumores pulmonares tienden a tener pequeño volumen pero con diámetros relativamente largos, mientras que los ganglios linfáticos mostraron volúmenes mayores pero diámetros principales algo más cortos que los tumores hepáticos. El equipo también examinó la intensidad (más brillante o más oscura) de estas regiones en la TC, una propiedad relacionada con la densidad tisular. Los tumores pulmonares, rodeados de aire, presentaron patrones de intensidad muy diferentes a los de los tumores hepáticos y los ganglios linfáticos, lo que sugiere que características numéricas sencillas de las imágenes de TC podrían ayudar a distinguir tipos de lesión. Es importante que el estudio confirmó una relación sólida entre el diámetro más largo de una lesión y su verdadero volumen 3-D, lo que respalda la idea de que reglas basadas en diámetros como RECIST pueden servir como sustituto práctico de las mediciones volumétricas completas cuando se aplican con cuidado.

Figure 2
Figura 2.

Poner a prueba el conjunto de datos con aprendizaje profundo

Para mostrar cómo puede utilizarse el conjunto de datos, los investigadores entrenaron y perfeccionaron dos tipos de sistemas de aprendizaje profundo. Primero, ajustaron finamente MedSAM para segmentar tumores automáticamente a partir de cajas delimitadoras simples, logrando puntuaciones de solapamiento con los contornos de los expertos en el mismo rango que las reportadas en conjuntos de datos internacionales mucho mayores. Segundo, adaptaron un marco ampliamente utilizado llamado nnUNet, partiendo de modelos entrenados en desafíos mundiales de imagenología pulmonar y hepática y luego afinándolos con estos nuevos datos chilenos. Tras el afinado, los sistemas igualaron o superaron su rendimiento original, especialmente para tumores pulmonares, pese a que la cohorte de pacientes era relativamente pequeña. Esto demuestra que datos locales cuidadosamente curados pueden aumentar significativamente la fiabilidad de las herramientas de IA en un entorno hospitalario concreto.

Qué significa esto para el futuro de la atención oncológica

Para los no especialistas, el mensaje clave es que este conjunto de datos es una herramienta habilitadora, no un producto diagnóstico por sí sola. Al compartir abiertamente TC en las que cada tumor y ganglio linfático visible ha sido delineado y, en muchos casos, medido con precisión, los autores brindan un terreno de entrenamiento realista para algoritmos que pretenden automatizar el seguimiento de tumores. Tales herramientas podrían ayudar a los radiólogos a dedicar menos tiempo a mediciones manuales y más tiempo a juicios complejos, además de reducir la variabilidad entre lectores. Como los datos provienen de un hospital latinoamericano y se publican bajo una licencia permisiva, también contribuyen a que la IA médica futura se pruebe en pacientes más diversos, mejorando las probabilidades de que el monitoreo automatizado del cáncer funcione de manera fiable para personas de todo el mundo.

Cita: Rojas-Pizarro, R., Vásquez-Venegas, C., Pereira, G. et al. A CT Dataset with RECIST Measurements and Comprehensive Segmentation Masks for Tumors and Lymph Nodes. Sci Data 13, 270 (2026). https://doi.org/10.1038/s41597-026-06597-6

Palabras clave: imagenología del cáncer, tomografías computarizadas, segmentación de tumores, RECIST, conjuntos de datos de IA médica