Clear Sky Science · es

Establecimiento de la enciclopedia de dermatopatología DermpathNet con flujo de trabajo basado en inteligencia artificial

· Volver al índice

Por qué importa una nueva biblioteca de imágenes cutáneas

Los cánceres de piel y otros crecimientos se diagnostican con frecuencia examinando cortes finos de tejido bajo el microscopio, un campo conocido como dermatopatología. Sin embargo, las imágenes que se usan para formar a los médicos y probar herramientas de inteligencia artificial (IA) suelen estar cerradas tras muros de pago o restricciones de privacidad. Este artículo presenta DermpathNet, una colección revisada con cuidado y de acceso libre de miles de imágenes de biopsias cutáneas construida con ayuda de IA. Está diseñada para facilitar y hacer más fiables el aprendizaje, la verificación de diagnósticos y el desarrollo de nuevas herramientas informáticas para clínicos e investigadores en todo el mundo.

Figure 1
Figure 1.

El problema de las láminas docentes ocultas

La mayoría de los residentes médicos aprenden a partir de portaobjetos de vidrio o archivos digitales controlados por un solo hospital. Estos materiales pueden contener identificadores de pacientes o estar licenciados de forma que impidan su distribución. Los recursos en línea existentes requieren suscripciones de pago, ofrecen solo un puñado de casos de ejemplo o pueden no estar revisados de forma consistente por expertos. Como resultado, estudiantes y clínicos carecen de una colección amplia, confiable y abierta de imágenes microscópicas de piel que muestre tumores comunes y raros. Sin dicho recurso, es difícil comparar casos, estandarizar la enseñanza o evaluar de manera justa el rendimiento real de los sistemas de visión por computador.

Encontrar imágenes de calidad en un mar de artículos

Los autores recurrieron a la colección de Acceso Abierto de PubMed Central, una vasta biblioteca de artículos biomédicos de texto completo cuyos contenidos pueden reutilizarse legalmente. Comenzaron con una lista estructurada, o léxico, de 12 grupos de tumores cutáneos benignos y malignos y casi 200 diagnósticos específicos, elaborada a partir de aportes de expertos y vocabularios médicos estandarizados. Usando este léxico, consultaron PubMed Central por artículos cuyos títulos o resúmenes mencionaran estas enfermedades, descargaron los textos completos y extrajeron todas las figuras y sus leyendas. Esta primera pasada produjo más de 200 000 figuras procedentes de más de 43 000 artículos: demasiadas, y la mayoría no eran realmente imágenes microscópicas de piel.

Cómo trabajaron juntos la IA y las palabras clave

Para separar las imágenes útiles de las irrelevantes, el equipo creó un sistema de filtrado híbrido. Una parte fue un modelo de aprendizaje profundo entrenado en una colección médica distinta para decidir si una imagen parecía o no una laminilla de patología. La otra parte buscó en las leyendas de las figuras frases reveladoras como niveles de aumento o términos de tinción que suelen acompañar a las imágenes de microscopio. Para diagnósticos muy comunes, solo se conservaron las imágenes que pasaban ambas pruebas, mejorando la pureza; para diagnósticos raros, se aceptaron imágenes que cumplían cualquiera de las dos pruebas para evitar perder ejemplos escasos. Cuando este método híbrido se comparó con un “patrón oro” humano de 651 imágenes etiquetadas manualmente, su rendimiento fue sólido, con una F-score superior al 90 %, mejor que usar solo IA o solo palabras clave.

Figure 2
Figure 2.

Qué contiene DermpathNet y cómo se utiliza

Tras el procesamiento, el flujo de trabajo produjo 7 772 imágenes que cubren 166 diagnósticos diferentes de tumores cutáneos. Cada imagen fue revisada por dermatopatólogos certificados, y cada una está vinculada a metadatos detallados que describen el artículo fuente, el tipo de enfermedad y códigos médicos estandarizados. El conjunto de datos está organizado para que los usuarios puedan explorar por categoría de enfermedad, diagnóstico específico o publicación original, al tiempo que se realiza seguimiento de la información de licencias. Más allá de la docencia, los autores usaron DermpathNet para sondear los límites de un modelo moderno de visión y lenguaje: GPT‑4v. Al pedirle identificar tumores cutáneos específicos en estas imágenes desafiantes en formatos de verdadero/falso, preguntas abiertas y opción múltiple, el modelo rindió mal, con frecuencia fallando en reconocer el diagnóstico correcto incluso cuando se le ofrecía una lista corta de alternativas.

Qué significa esto para médicos y máquinas

Para los no especialistas, DermpathNet puede considerarse un atlas de alta calidad y de acceso abierto de tumores cutáneos microscópicos, construido con un sistema de clasificación inteligente que permite a los expertos humanos centrarse en las comprobaciones finales en lugar de en la navegación manual. Reduce las barreras para la formación y la comparación entre instituciones y pone de manifiesto la dificultad de la tarea visual: incluso un sistema de IA de vanguardia tuvo problemas con estas imágenes. Los autores concluyen que, aunque la IA puede ayudar a ensamblar recursos de este tipo, los modelos de uso general actuales aún no están preparados para reemplazar el juicio de los especialistas en dermatopatología. En su lugar, DermpathNet ofrece una base sólida para la enseñanza y para construir la próxima generación de herramientas médicas de IA dedicadas que puedan realmente ayudar en el diagnóstico de enfermedades de la piel.

Cita: Xu, Z., Lin, M., Zhou, Y. et al. Establishing dermatopathology encyclopedia DermpathNet with Artificial Intelligence-Based Workflow. Sci Data 13, 368 (2026). https://doi.org/10.1038/s41597-026-06715-4

Palabras clave: dermatopatología, conjunto de datos de imágenes médicas, inteligencia artificial, cáncer de piel, patología digital