Clear Sky Science · es

Clasificación multiclase de tumores cerebrales usando una columna vertebral ResNet101 integrada con un módulo de atención deformable multi-escala y aumentos de datos avanzados

· Volver al índice

Por qué importa clasificar las exploraciones cerebrales

Cuando los médicos revisan exploraciones cerebrales para detectar tumores, deben determinar no solo si hay un tumor sino también qué tipo es. Diferentes tipos de tumor requieren tratamientos distintos, y sin embargo pueden parecer notablemente similares en una resonancia magnética (RM). Este estudio explora un nuevo enfoque de inteligencia artificial capaz de clasificar muchas clases de tumores cerebrales a partir de RM con una precisión muy alta, lo que podría ofrecer a los radiólogos un apoyo más rápido y consistente al tomar decisiones que afectan la vida del paciente.

Figure 1. Cómo la IA convierte las resonancias cerebrales en conjuntos claros de múltiples tipos de tumores.
Figure 1. Cómo la IA convierte las resonancias cerebrales en conjuntos claros de múltiples tipos de tumores.

Enseñar a las máquinas a leer exploraciones cerebrales

Los investigadores se centran en la clasificación multiclase, es decir, en distinguir simultáneamente muchas categorías de tumor en lugar de limitarse a detectar tumor versus ausencia de tumor. Usan un modelo de aprendizaje profundo basado en ResNet101, una red de reconocimiento de imágenes ampliamente utilizada que ya ha aprendido patrones visuales generales a partir de grandes colecciones de imágenes naturales. El equipo adapta esta red a las RM cerebrales y la aplica a un conjunto de datos público que incluye 15 clases, desde tejido cerebral normal hasta tumores específicos como glioblastoma, meningioma y meduloblastoma. Afrontar tantas categorías aproxima la tarea a la que se enfrentan los radiólogos en la práctica clínica real.

Limpiar y equilibrar datos del mundo real

Las colecciones de imágenes médicas a menudo contienen trampas ocultas, como exploraciones duplicadas del mismo paciente o grandes diferencias en la frecuencia de cada tipo de tumor. Para evitar resultados engañosos, los autores primero revisan todo el conjunto de datos, calculan una huella digital digital para cada imagen y eliminan duplicados exactos. Después agrupan las imágenes por ID de paciente y dividen pacientes —no imágenes— en conjuntos de entrenamiento, validación y prueba, de modo que las exploraciones de la misma persona nunca aparezcan en más de un subconjunto. Esta división por paciente ayuda a garantizar que la precisión reportada refleje el rendimiento en individuos verdaderamente no vistos en lugar de vistas repetidas del mismo cerebro. El equipo también utiliza una batería de transformaciones de imagen y una técnica llamada MixUp para que los tipos de tumor raros estén mejor representados durante el entrenamiento y para ayudar al modelo a lidiar con variaciones en orientación, brillo y ruido.

Figure 2. Cómo la atención multi-escala flexible permite a la IA centrarse en regiones clave de la RM cerebral para separar tipos de tumores.
Figure 2. Cómo la atención multi-escala flexible permite a la IA centrarse en regiones clave de la RM cerebral para separar tipos de tumores.

Observar más de cerca con atención flexible

Una innovación clave del estudio es un módulo que los autores denominan módulo de atención deformable multi-escala. En términos sencillos, el modelo examina la RM en distintos niveles de detalle, desde las estructuras generales de todo el cerebro hasta texturas más finas cerca del tumor. En lugar de inspeccionar cada ubicación de forma rígida y en una cuadrícula, la atención deformable aprende a desplazar ligeramente dónde “mira” para poder centrarse en regiones informativas. A continuación aplica dos formas complementarias de atención: una que resalta puntos importantes en la imagen y otra que refuerza los canales de características más útiles dentro de la red. Esta combinación permite al sistema captar mejor las sutiles diferencias de forma y textura que distinguen un tipo de tumor de otro.

Poner a prueba rendimiento y confianza

Tras entrenar durante muchos ciclos, el modelo alcanza una precisión de validación de alrededor del 97 por ciento y una precisión en el conjunto de prueba superior al 99 por ciento en las 15 clases. La mayoría de los tipos de tumor se clasifican a la perfección en el conjunto de prueba mantenido aparte, con solo unos pocos errores en categorías de tumores que son tanto raras como visualmente similares. Los investigadores comparan sus resultados con un método previo que también emplea atención deformable y muestran que su enfoque lo iguala o supera en casi todas las medidas de evaluación, pese a la compleja mezcla de clases. Además someten el sistema a pruebas de resistencia añadiendo ruido y reduciendo la resolución de las imágenes, y descubren que la precisión se mantiene alta incluso cuando la calidad de la exploración empeora, lo cual es importante para las condiciones reales en hospitales.

Ver lo que el modelo ve

Para ayudar a los clínicos a confiar en el sistema, los autores usan herramientas de visualización que revelan dónde se centra la red al tomar una decisión. Los mapas de calor producidos por Grad-CAM resaltan las áreas de la RM que más influyeron en la predicción, y los análisis basados en SHAP indican qué características aprendidas empujan al modelo hacia un diagnóstico u otro. Estas explicaciones visuales señalan de manera consistente las regiones tumorales y sus límites en lugar de fondos irrelevantes, lo que sugiere que el razonamiento del modelo se alinea con la intuición radiológica. Aunque el estudio enfatiza que se necesitan más pruebas externas, demuestra que una canalización de aprendizaje profundo cuidadosamente diseñada puede no solo clasificar con alta fiabilidad muchos tipos de tumores cerebrales, sino también ofrecer pistas interpretables sobre cómo se toman esas decisiones.

Qué podría significar esto para los pacientes

En la práctica clínica cotidiana, este tipo de sistema no reemplazaría a los radiólogos sino que actuaría como un segundo lector, señalando rápidamente los tipos de tumor más probables y llamando la atención sobre regiones sospechosas en la exploración. Al manejar una amplia variedad de tumores y mantenerse estable ante imágenes con ruido o de menor calidad, el marco descrito en este artículo muestra cómo la IA podría apoyar diagnósticos más consistentes y oportunos. Con validación adicional en distintos hospitales y escáneres, estas herramientas podrían integrarse en los flujos de trabajo rutinarios, ayudando a los especialistas a centrarse en la planificación del tratamiento mientras los sistemas computacionales se ocupan de gran parte de la clasificación repetitiva de imágenes.

Cita: Reddy, B.S., Jha, R.R., Dasore, A. et al. Multi-class classification of brain tumor using a ResNet101 backbone integrated with multi-scale deformable attention module and advanced data augmentations. Sci Rep 16, 15938 (2026). https://doi.org/10.1038/s41598-026-45675-y

Palabras clave: tumor cerebral RM, aprendizaje profundo, IA en imagen médica, clasificación de tumores, redes de atención