Clear Sky Science · es

PETWB-REP: Un conjunto de datos FDG PET/CT de todo el cuerpo para múltiples cánceres con informes radiológicos correspondientes

· Volver al índice

Por qué importa este nuevo recurso de imagen oncológica

Los oncólogos dependen cada vez más de exploraciones avanzadas y herramientas informáticas para ver cómo se comportan los tumores en todo el cuerpo. Pero los potentes sistemas de inteligencia artificial necesitan colecciones enormes y cuidadosamente organizadas de exploraciones reales de pacientes para aprender, y esos recursos son sorprendentemente escasos y difíciles de compartir de forma segura. Este artículo presenta PETWB-REP, una nueva colección pública de exploraciones de todo el cuerpo en cáncer con informes médicos vinculados que tiene como objetivo acelerar el desarrollo de mejores herramientas diagnósticas y una investigación más precisa a nivel mundial.

Figure 1
Figure 1.

Una ventana al cuerpo entero

El proyecto PETWB-REP se centra en un tipo de exploración llamada FDG PET/CT, que combina dos perspectivas del cuerpo a la vez. La parte CT muestra la anatomía detallada, como huesos y órganos, mientras que la parte PET ilumina áreas que consumen mucha glucosa, frecuentemente indicio de cáncer activo. Al fusionar estas imágenes, los médicos pueden ver no solo dónde están los tumores, sino cuán activos son. El nuevo conjunto de datos reúne exploraciones de todo el cuerpo de 490 personas con distintos tipos de cáncer, incluidos pulmón, hígado, mama, próstata, ovario y otros, lo que lo hace mucho más amplio que muchas colecciones anteriores que se centraban en un solo tipo tumoral.

De la visita clínica a datos listos para investigación

Todas las exploraciones se recogieron en un gran centro de imagen en Shanghái entre 2021 y 2024 durante la atención rutinaria, bajo la supervisión de un comité de ética. Los pacientes ayunaron antes de las exploraciones, recibieron una inyección cuidadosamente medida de un azúcar radiactivo y luego reposaron para permitir que el trazador se distribuyera por el cuerpo. Cada exploración cubrió desde la base del cráneo hasta la mitad del muslo, siguiendo un protocolo estandarizado para que las imágenes fueran comparables entre pacientes. Además de las propias imágenes, el equipo registró información básica como edad, sexo, tipo de cáncer y detalles de cómo se realizaron las exploraciones, y almacenó todo en una estructura coherente diseñada para compartir imágenes médicas.

Protegiendo la privacidad sin perder detalle

Convertir exploraciones clínicas en un recurso público seguro requirió un proceso cuidadoso para eliminar la información personal preservando el detalle médico útil. Los investigadores primero borraron nombres, identificadores y otros datos de los archivos de imagen y los reemplazaron por códigos de estudio. Luego utilizaron una herramienta especializada para eliminar digitalmente rasgos faciales de las imágenes CT para que los pacientes no pudieran ser reconocidos, manteniendo intacta la anatomía del cuello y el cuerpo para el análisis. Dos investigadores revisaron manualmente las exploraciones y los textos para asegurarse de que no quedara nada identificable. El resultado es un conjunto de imágenes e informes que conservan los patrones tumorales y la estructura orgánica, pero que ya no revelan la identidad de los pacientes.

Un puente entre imágenes y palabras

Una característica distintiva de PETWB-REP es que cada exploración va acompañada de un informe radiológico completo redactado por médicos experimentados en medicina nuclear. Estos informes describen lo observado en distintas regiones del cuerpo, anotan el tamaño y comportamiento de las áreas sospechosas y concluyen con una impresión global. Para abrir el conjunto de datos a una audiencia global, los informes originales en chino se tradujeron al inglés mediante traducción automática y luego fueron cuidadosamente corregidos por un especialista bilingüe, publicándose ambos idiomas lado a lado. Este emparejamiento rico de imágenes y narrativa hace que el conjunto sea ideal para entrenar sistemas informáticos que puedan vincular patrones en las imágenes con la forma en que los médicos los describen e interpretan.

Figure 2
Figure 2.

Cómo pueden usar los investigadores este recurso

El conjunto final de datos está organizado en exploraciones "raw" y versiones procesadas que son más fáciles de manejar por los ordenadores. El equipo convirtió los datos a un formato de investigación ampliamente usado, ajustó el brillo y el contraste de las imágenes, alineó las vistas PET y CT y creó una tabla maestra que resume cada caso. También realizaron controles de calidad para asegurar que cada paciente tenga exploraciones y informes coincidentes y que las imágenes estén libres de fallos importantes. Con esta base, los investigadores pueden construir y probar herramientas para localizar y delinear tumores automáticamente, combinar información de imagen y texto para predecir resultados o generar borradores de informes a partir de las exploraciones. Aunque los datos proceden de un único centro y la mezcla de tipos de cáncer refleja la práctica local, el tamaño, la variedad y la preparación cuidadosa de PETWB-REP lo convierten en un valioso punto de partida tanto para estudios médicos como de inteligencia artificial.

Cita: Xue, L., Feng, G., Zhang, W. et al. PETWB-REP: A Multi-Cancer Whole-Body FDG PET/CT Dataset with Corresponding Radiology Reports. Sci Data 13, 675 (2026). https://doi.org/10.1038/s41597-026-07058-w

Palabras clave: imagen PET/CT, conjunto de datos multicáncer, informes radiológicos, IA médica, imagen multimodal