Clear Sky Science · pt
Estabelecendo a enciclopédia de dermatopatologia DermpathNet com fluxo de trabalho baseado em Inteligência Artificial
Por que uma nova biblioteca de imagens de pele importa
Os cânceres de pele e outras lesões frequentemente são diagnosticados pela análise de cortes finos de tecido ao microscópio, uma área conhecida como dermatopatologia. Ainda assim, as imagens usadas para treinar médicos e testar ferramentas de inteligência artificial (IA) costumam ficar atrás de paywalls ou restrições de privacidade. Este artigo apresenta o DermpathNet, uma coleção cuidadosamente revisada e de acesso livre com milhares de imagens de biópsias de pele construída com o auxílio de IA. O recurso foi projetado para facilitar e tornar mais confiáveis o aprendizado, a verificação de diagnósticos e o desenvolvimento de novas ferramentas computacionais para clínicos e pesquisadores em todo o mundo. 
O problema dos lâminas de ensino ocultas
A maioria dos estudantes de medicina aprende com lâminas de vidro ou arquivos digitais controlados por um único hospital. Esses materiais podem conter identificadores de pacientes ou ser licenciados de maneiras que impedem o compartilhamento. Recursos online existentes exigem assinaturas pagas, oferecem apenas um punhado de casos de exemplo ou podem não ser revisados de forma consistente por especialistas. Como resultado, estudantes e clínicos carecem de uma coleção ampla, confiável e aberta de imagens microscópicas de pele que mostre tumores comuns e raros. Sem esse recurso, é difícil comparar casos, padronizar o ensino ou avaliar de forma justa o desempenho de sistemas de visão computacional.
Encontrando imagens de qualidade em um mar de artigos
Os autores recorreram à coleção Open Access do PubMed Central, uma vasta biblioteca de artigos biomédicos em texto completo cujo conteúdo pode ser legalmente reutilizado. Começaram com uma lista estruturada, ou léxico, de 12 grupos de tumores de pele benignos e malignos e quase 200 diagnósticos específicos, construída a partir de contribuições de especialistas e vocabulários médicos padronizados. Usando esse léxico, consultaram o PubMed Central por artigos cujos títulos ou resumos mencionassem essas doenças, baixaram os textos completos e extraíram todas as figuras e legendas. Essa primeira triagem rendeu mais de 200.000 figuras de mais de 43.000 artigos — longe do necessário, e a maioria não era realmente imagens microscópicas de pele.
Como IA e palavras-chave funcionaram juntas
Para separar imagens úteis das irrelevantes, a equipe criou um sistema de filtragem híbrido. Uma parte era um modelo de deep learning treinado em uma coleção médica separada para decidir se uma imagem parecia ou não um lâmina de patologia. A outra parte examinava as legendas das figuras em busca de expressões indicativas, como níveis de aumento ou termos de coloração, que costumam acompanhar imagens de microscópio. Para diagnósticos muito comuns, apenas imagens que passavam nos dois testes eram mantidas, melhorando a pureza; para diagnósticos raros, aceitavam-se imagens que passassem em qualquer um dos testes para evitar perder exemplos escassos. Quando esse método híbrido foi confrontado com um “padrão-ouro” humano de 651 imagens rotuladas manualmente, seu desempenho foi forte, com F-score superior a 90%, melhor do que usar apenas IA ou apenas palavras-chave. 
O que o DermpathNet contém e como é usado
Após o processamento, o fluxo de trabalho produziu 7.772 imagens cobrindo 166 diagnósticos diferentes de tumores de pele. Cada imagem foi revisada por dermatopatologistas certificados, e cada uma está vinculada a metadados completos que descrevem o artigo-fonte, o tipo de doença e códigos médicos padronizados. O conjunto de dados está organizado para que os usuários possam explorar por categoria de doença, diagnóstico específico ou publicação original, além de acompanhar informações de licenciamento. Além do uso educacional, os autores usaram o DermpathNet para sondar os limites de um modelo moderno de visão–linguagem: o GPT‑4v. Quando solicitado a identificar tumores de pele específicos nessas imagens desafiadoras em formatos verdadeiro/falso, aberto e múltipla escolha, o modelo teve desempenho fraco, muitas vezes falhando em reconhecer o diagnóstico correto mesmo quando apresentado com uma lista curta de opções.
O que isso significa para médicos e máquinas
Para não especialistas, o DermpathNet pode ser visto como um atlas de alta qualidade e de uso aberto de tumores cutâneos microscópicos, construído com um sistema de triagem inteligente que permite aos especialistas humanos focar nas checagens finais em vez da navegação manual. Ele reduz barreiras ao treinamento e à comparação entre instituições e expõe a dificuldade da tarefa visual: mesmo um sistema de IA de ponta encontrou dificuldades nestas imagens. Os autores concluem que, embora a IA possa ajudar a montar esses recursos, os modelos generalistas atuais ainda não estão prontos para substituir o julgamento do especialista em dermatopatologia. Em vez disso, o DermpathNet oferece uma base sólida para o ensino e para a construção da próxima geração de ferramentas médicas de IA dedicadas que possam realmente auxiliar no diagnóstico de doenças de pele.
Citação: Xu, Z., Lin, M., Zhou, Y. et al. Establishing dermatopathology encyclopedia DermpathNet with Artificial Intelligence-Based Workflow. Sci Data 13, 368 (2026). https://doi.org/10.1038/s41597-026-06715-4
Palavras-chave: dermatopatologia, conjunto de imagens médicas, inteligência artificial, câncer de pele, patologia digital