Clear Sky Science · es

Clasificación precisa de lesiones cutáneas en imágenes dermatoscópicas desequilibradas con alta varianza mediante el marco SCTFD

· Volver al índice

Por qué importan revisiones de piel más inteligentes

El cáncer de piel es uno de los tipos de cáncer más comunes, pero también uno de los más curables si se detecta a tiempo. Los dermatólogos confían cada vez más en fotografías en primer plano de lunares y manchas, tomadas con un amplificador manual llamado dermatoscopio, para decidir cuáles son peligrosas. Sin embargo, interpretar estas imágenes es difícil, incluso para expertos, y los sistemas informáticos que podrían ayudar suelen fallar porque algunos tipos de cáncer son raros y las lesiones pueden verse muy distintas entre pacientes. Este estudio presenta un nuevo marco de inteligencia artificial (IA), llamado SCTFD, diseñado para hacer que la clasificación automatizada de lesiones cutáneas sea más precisa y fiable precisamente en estas situaciones complejas.

Figure 1
Figure 1.

El desafío de las manchas cutáneas raras y complejas

Las colecciones de imágenes cutáneas del mundo real están lejos de ser equilibradas. Los lunares comunes, en su mayoría inofensivos, aparecen miles de veces en los datos de entrenamiento, mientras que cánceres graves como el melanoma o tumores raros aparecen sólo unas pocas centenas de veces o menos. Al mismo tiempo, las lesiones de una misma enfermedad pueden variar mucho en tamaño, color y forma. Los sistemas de IA estándar tienden a sobreajustarse a los patrones comunes y pasar por alto los raros, lo cual es peligroso en medicina: es preferible no confundir un lunar inofensivo que no detectar un melanoma. Las estrategias clásicas, como simplemente copiar imágenes raras o mezclarlas entre sí, o usar modelos generativos complejos, tienen limitaciones en realismo, estabilidad o coste computacional. SCTFD se diseñó específicamente para manejar este desequilibrio y la variabilidad manteniéndose suficientemente eficiente para uso práctico.

Generar mejores ejemplos de entrenamiento

El primer bloque de construcción de SCTFD es un generador de datos llamado CN-SMOTE. En lugar de interpolar valores de píxeles o entrenar una red adversarial generativa frágil, CN-SMOTE utiliza un par codificador–decodificador: una red comprime una imagen dermatoscópica en un código interno compacto y otra la reconstruye de nuevo en una imagen. Una vez aprendido este espacio compacto, el método encuentra vecinos cercanos entre las lesiones de clase rara e interpola entre sus códigos, luego decodifica esos códigos mixtos de vuelta a nuevas imágenes. Una penalización de entrenamiento especial mantiene los códigos internos de lesiones del mismo tipo próximos entre sí, de modo que las imágenes sintéticas siguen siendo realistas y fieles a la enfermedad subyacente. El resultado es una colección más amplia y equilibrada de imágenes dermatoscópicas en la que los tipos de lesión raros pero importantes están mejor representados.

Ver tanto los detalles como el panorama general

El segundo componente, MARD-Net, se centra en convertir cada imagen en un conjunto rico de características reveladoras. Las capas convolucionales actúan como lupas ajustables que captan patrones finos como bordes y texturas. Además, un módulo de atención enseña a la red a concentrarse en la pequeña región donde realmente está la lesión, restando importancia a la piel sana circundante que podría distraer al modelo. Finalmente, una etapa basada en Transformers examina toda la imagen para capturar relaciones entre partes distantes de la lesión, como la disposición de distintos colores y estructuras. Para evitar el elevado coste computacional que suelen implicar los Transformers, los autores introducen una estrategia de ventana deslizante que permite al modelo obtener una visión amplia de la lesión haciendo cálculos de atención focalizados sólo en regiones seleccionadas, lo que lo hace más rápido y eficiente en memoria.

Figure 2
Figure 2.

Guiar al modelo para tratar cada clase con justicia

El tercer pilar de SCTFD es un nuevo objetivo de entrenamiento llamado FDLoss, que indica a la IA cómo ajustarse durante el aprendizaje. En lugar de contar cada imagen por igual, FDLoss da más peso a los casos difíciles y raros para que el modelo no pueda “conformarse” obteniendo buenos resultados sólo en los ejemplos abundantes y fáciles. Combina ideas de dos métricas populares: una que premia un buen equilibrio entre sensibilidad y precisión, y otra que reduce el peso de ejemplos triviales que la red ya clasifica correctamente. Además, FDLoss añade un término que fomenta que las imágenes de la misma enfermedad formen agrupaciones cerradas en el espacio interno del modelo, mientras separa más las enfermedades distintas. Esta combinación combate directamente tanto el desequilibrio de clases como la gran variación dentro de cada clase que suele confundir a los clasificadores.

Qué tan bien funciona el nuevo enfoque

Los autores probaron SCTFD en dos bancos de pruebas internacionales de imágenes cutáneas ampliamente usados, ISIC 2018 e ISIC 2019, que contienen decenas de miles de imágenes dermatoscópicas clínicas reales con siete y ocho tipos de lesión, respectivamente, y están fuertemente sesgados hacia los lunares comunes. En comparación con varios métodos de última generación, SCTFD consiguió mayor precisión y un equilibrio notablemente mejor entre detectar verdaderos positivos y evitar falsas alarmas. Mejoró la precisión global hasta aproximadamente un 93% en ISIC 2018 y un 91% en ISIC 2019, y elevó la puntuación F1 —una medida que equilibra omisiones y errores de etiquetado— por encima de todos los sistemas competidores. Las visualizaciones mostraron que sus módulos de atención se centran precisamente en las regiones de la lesión y que las características de distintas enfermedades quedan más claramente separadas tras el entrenamiento.

Qué supone esto para pacientes y médicos

Para los pacientes, la promesa de SCTFD es una segunda opinión más fiable cuando aparece una mancha sospechosa en la piel. Al sintetizar ejemplos realistas de cánceres raros, concentrarse en las partes más informativas de cada imagen y entrenar con una función de pérdida que fuerza una separación clara entre tipos de enfermedad, el marco reduce el riesgo de que los sistemas automatizados pasen por alto lesiones peligrosas simplemente porque son infrecuentes o atípicas. Si bien no sustituye el juicio de un dermatólogo, este enfoque podría reducir la barrera para un diagnóstico temprano y preciso en clínicas y plataformas de telemedicina, potencialmente detectando cánceres de piel mortales de forma más temprana y consistente.

Cita: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8

Palabras clave: detección de cáncer de piel, IA en dermatoscopia, clasificación de imágenes médicas, conjuntos de datos desequilibrados, aprendizaje profundo en dermatología