Clear Sky Science · pt

Conjunto de Dados Integrado de Lesões Odontogênicas Dentárias em CBCT e Histopatologia para Benchmarking de Algoritmos de Deep Learning

· Voltar ao índice

Por que as lesões na mandíbula interessam além dos dentistas

Crescimentos estranhos na mandíbula podem parecer um problema odontológico restrito, mas podem significar coisas muito diferentes para a saúde e o tratamento da pessoa. Alguns são cistos simples que podem ser removidos com um procedimento pequeno, enquanto outros exigem cirurgia extensa para evitar recidiva. Hoje, os médicos dependem de exames detalhados semelhantes a raios-X e de estudos microscópicos do tecido para distinguir esses problemas que se parecem. Este artigo descreve um novo recurso de dados compartilhado que pode ajudar a inteligência artificial a aprender a tomar essas decisões complexas de forma mais rápida e consistente.

Vendo a mandíbula inteira em três dimensões

Quando dentistas ou cirurgiões suspeitam de uma lesão mandibular, frequentemente recorrem à tomografia computadorizada cone-beam, ou CBCT. Esse exame cria uma imagem tridimensional da cabeça que mostra ossos e dentes em detalhes finos com doses de radiação relativamente baixas. Ajuda os cirurgiões a planejar quanto tecido remover e como evitar nervos e raízes dentárias. O problema é que muitas lesões mandibulares comuns têm formas e posições muito semelhantes nesses exames. Mesmo especialistas experientes podem discordar sobre o que estão vendo, o que pode afetar tanto o diagnóstico quanto as escolhas de tratamento. Sistemas computacionais automatizados poderiam ajudar, mas precisam de coleções grandes e bem rotuladas de imagens para aprender.

Figure 1. Exames mandibulares pareados e imagens de tecido alimentam um sistema de IA para melhor classificar lesões mandibulares de aparência semelhante.
Figure 1. Exames mandibulares pareados e imagens de tecido alimentam um sistema de IA para melhor classificar lesões mandibulares de aparência semelhante.

Observando o tecido no microscópio

A maneira mais confiável de identificar essas lesões mandibulares ainda vem do microscópio. Após a cirurgia, o tecido removido é cortado em lâminas ultrafinas, corado com tinturas e digitalizado em imagens de alta resolução. Os patologistas então estudam os padrões celulares para decidir se uma lesão é um cisto benigno ou um tumor, e a qual subtipo pertence. Por exemplo, quatro tipos predominam na mandíbula: cistos dentígeros, cistos radiculares, queratoquistos odontogênicos e ameloblastomas. Cada um tem uma aparência e comportamento típicos. No entanto, essa resposta de referência só chega depois da operação. Pacientes e médicos não podem usá-la para ajustar uma cirurgia já realizada, por isso ferramentas pré-cirúrgicas melhores são tão importantes.

Unindo exames e lâminas

O novo conjunto de dados DOLCHID aborda essa lacuna ao emparelhar cuidadosamente exames de CBCT com imagens de microscópio correspondentes das mesmas lesões mandibulares. Os criadores coletaram dados de 262 pacientes cujas lesões tinham diagnósticos claros e imagens de boa qualidade pelos dois métodos. Para cada caso, radiologistas marcaram a região exata da lesão no exame, e patologistas contornaram a área mais informativa na lâmina corada. O conjunto de dados é equilibrado entre os quatro principais tipos de lesão e inclui exemplos desafiadores e limítrofes para espelhar a complexidade clínica real. Todas as informações pessoais foram removidas e as imagens foram armazenadas em formatos padrão para que equipes de pesquisa ao redor do mundo possam trabalhar com elas.

Figure 2. Recursos combinados de exames 3D da mandíbula e imagens em nível celular orientam a IA a distinguir quatro tipos de lesões mandibulares.
Figure 2. Recursos combinados de exames 3D da mandíbula e imagens em nível celular orientam a IA a distinguir quatro tipos de lesões mandibulares.

Testando o quanto os computadores aprendem com os dados

Para demonstrar que o conjunto de dados é útil, a equipe realizou uma série de testes com métodos de deep learning de ponta. Primeiro, treinaram modelos computacionais para delinear os contornos das lesões tanto em imagens de CBCT quanto em imagens de microscópio. Vários desenhos de modelos diferentes aprenderam a localizar as lesões com precisão sólida, o que sugere que as imagens e as marcações de especialistas são consistentes e informativas. Em seguida, treinaram modelos separados para classificar o tipo de lesão usando apenas os exames ou apenas as imagens de tecido. Como esperado, os modelos que viram imagens de microscópio tiveram desempenho muito forte, enquanto os que usaram apenas CBCT se saíram razoavelmente bem, dado o quão semelhantes as lesões podem parecer.

O que acontece quando ambas as perspectivas são combinadas

Os experimentos mais promissores utilizaram os dois tipos de imagem juntos. Os pesquisadores construíram métodos que primeiro aprenderam recursos separados de exames CBCT e de lâminas de tecido, depois fundiram esses sinais em uma representação compartilhada. Mesmo quando somente o exame estaria disponível durante o diagnóstico na prática clínica, o processo de treinamento ainda poderia se beneficiar do que as imagens de microscópio ensinaram ao modelo. Esses sistemas multimodais atingiram desempenho superior aos modelos apenas com CBCT, mostrando que dados pareados podem aguçar a capacidade do computador de perceber diferenças sutis entre tipos de lesão.

Como este trabalho pode ajudar futuros pacientes

Para o público geral, a mensagem principal é que este estudo não introduz um novo dispositivo médico, mas sim um conjunto de ensino cuidadosamente curado para algoritmos inteligentes. Ao vincular exames tridimensionais da mandíbula com vistas de microscópio correspondentes e rótulos de especialistas, o conjunto de dados DOLCHID fornece aos pesquisadores o material bruto necessário para construir e comparar de forma justa ferramentas de IA para diagnóstico de lesões mandibulares. Ao longo do tempo, tais ferramentas poderiam ajudar clínicos a identificar tumores agressivos mais cedo, escolher o nível de cirurgia adequado e reduzir a incerteza para pacientes que enfrentam procedimentos odontológicos e faciais complexos.

Citação: Huang, Z., Xia, T., Wu, T. et al. Dental Odontogenic Lesion CBCT and Histopathology Integrated Dataset for Benchmarking Deep Learning Algorithms. Sci Data 13, 758 (2026). https://doi.org/10.1038/s41597-026-07112-7

Palavras-chave: lesões odontogênicas, imagem dentária, tomografia computadorizada cone-beam, histopatologia, conjunto de dados de deep learning