Clear Sky Science · es

BRISC: Conjunto de datos anotados para la segmentación y clasificación de tumores cerebrales

· Volver al índice

Por qué los datos de exploraciones cerebrales importan para todos

Los tumores cerebrales están entre los diagnósticos más temidos que una persona puede recibir, y los médicos confían cada vez más en programas informáticos para ayudar a detectar y delinear estos crecimientos peligrosos en imágenes de resonancia magnética. Pero, como estudiantes que estudian con un libro con páginas faltantes, muchos de los sistemas de inteligencia artificial (IA) actuales se ven limitados por datos incompletos o inconsistentes. Este artículo presenta BRISC, una nueva colección cuidadosamente ensamblada de imágenes de resonancia magnética cerebral creada para proporcionar a la IA médica ejemplos de alta calidad que le permitan detectar y mapear mejor los tumores cerebrales —un trabajo que en última instancia podría apoyar diagnósticos más rápidos y fiables.

Figure 1
Figure 1.

Una nueva biblioteca de imágenes cerebrales

El conjunto de datos BRISC reúne 6.000 imágenes de resonancia magnética cerebral centradas en un tipo específico de exploración: imágenes ponderadas en T1 con contraste, que son particularmente buenas para resaltar los bordes del tumor. Cada imagen pertenece a uno de cuatro grupos: tres tipos tumorales comunes (glioma, meningioma y tumores pituitarios) más un grupo no tumoral que incluye cerebros sanos y otras condiciones no cancerosas. Las imágenes provienen de varias colecciones públicas anteriores, pero BRISC añade lo que a esos conjuntos antiguos les faltaba en gran medida: contornos precisos de las regiones tumorales y etiquetas coherentes, creadas y comprobadas por expertos médicos.

Equilibrando vistas y tipos de tumores

Un problema importante con muchas colecciones existentes es el desequilibrio: algunos tipos de tumor o ángulos de exploración dominan, empujando a los modelos de IA a rendir bien solo en los patrones más comunes que ven. BRISC aborda esto diseñando una distribución más uniforme tanto de diagnósticos como de direcciones de visualización. Las imágenes se proporcionan en tres vistas estándar de resonancia magnética —axial (de arriba abajo), coronal (de delante hacia atrás) y sagital (de lado a lado)— con números similares en cada una. Las cuatro categorías de diagnóstico también se mantienen relativamente equilibradas en las divisiones de entrenamiento y prueba. Este diseño cuidadoso ayuda a que los futuros algoritmos aprendan a reconocer tumores desde múltiples ángulos y en una gama más amplia de situaciones, reflejando mejor lo que los médicos ven en las consultas.

Limpieza cuidadosa y delineado experto

Convertir exploraciones en bruto en un recurso de investigación fiable requirió una depuración sustancial. El equipo comenzó con más de 7.000 imágenes tomadas de una colección online popular de tumores cerebrales y eliminó exploraciones de baja calidad o corruptas, imágenes casi duplicadas y secuencias demasiado cortas para una interpretación fiable. Solo se conservaron las exploraciones T1 con contraste para mantener la coherencia. Médicos y un radiólogo revisaron entonces las imágenes, corrigiendo etiquetas erróneas y eliminando casos cuestionables. Usando una herramienta de etiquetado especializada, trazaron máscaras detalladas alrededor de las regiones tumorales, refinando su trabajo repetidamente hasta alcanzar un alto grado de acuerdo; en un subconjunto de prueba, la coincidencia entre los contornos iniciales y los aprobados por expertos fue muy alta.

Figure 2
Figure 2.

Qué permite este dato para los modelos de IA

Para mostrar cómo puede usarse BRISC, los autores entrenaron una serie de modelos de IA populares en dos tareas. La primera tarea pide a un modelo que clasifique cada imagen en una de las cuatro categorías de diagnóstico. Los sistemas modernos de reconocimiento de imágenes, especialmente la familia EfficientNet, lograron una precisión muy alta —etiquetando correctamente la gran mayoría de las exploraciones y rindiendo particularmente bien al distinguir imágenes sin tumor. La segunda tarea pide a los modelos que coloreen la zona tumoral, píxel por píxel, en la rebanada de la RM. Aquí, las redes de segmentación más avanzadas, incluidas arquitecturas basadas en transformadores que sobresalen en modelar el contexto, ofrecieron las mejores puntuaciones, delineando con precisión los tumores en los tres tipos tumorales principales.

Cómo este trabajo hace avanzar el campo

En términos sencillos, BRISC es un «campo de entrenamiento» público bien organizado para ordenadores que aprenden a leer RM cerebrales. Ofrece miles de exploraciones cuidadosamente depuradas, variedad realista entre tipos de tumor y ángulos de visualización, y contornos tumorales dibujados por expertos que enseñan a los algoritmos exactamente dónde está presente la enfermedad. Si bien el conjunto de datos está destinado a la investigación —no como una herramienta de diagnóstico independiente para pacientes— proporciona una base sólida para construir y comparar nuevos sistemas de IA. A medida que los investigadores perfeccionen modelos usando BRISC y recursos similares, los médicos podrían tener algún día asistentes digitales más fiables a su lado, ayudándoles a detectar tumores cerebrales antes y a planificar tratamientos con mayor confianza.

Cita: Fateh, A., Rezvani, Y., Moayedi, S. et al. BRISC: Annotated Dataset for Brain Tumor Segmentation and Classification. Sci Data 13, 361 (2026). https://doi.org/10.1038/s41597-026-06753-y

Palabras clave: resonancia magnética tumor cerebral, IA en imagen médica, segmentación de tumores, curación de conjuntos de datos, radiología aprendizaje profundo