Clear Sky Science · pt
Um conjunto de dados abrangente baseado em smartphone de imagens anotadas da cavidade oral para melhorar o diagnóstico de doenças bucais
Por que seu telefone pode ajudar a detectar câncer de boca
A maioria de nós carrega uma câmera poderosa no bolso, mas ela raramente é usada para procurar sinais precoces de doença dentro da boca. O câncer oral e seus sinais de alerta muitas vezes passam despercebidos até estarem avançados, especialmente em comunidades com poucos especialistas. Este estudo descreve o SMART‑OM, uma coleção cuidadosamente curada de fotografias do interior da boca, todas feitas com smartphones comuns e meticulosamente rotuladas por especialistas em odontologia. O objetivo é fornecer aos pesquisadores o material bruto necessário para construir ferramentas de inteligência artificial que possam sinalizar mudanças preocupantes muito antes de se tornarem letais.

O problema global dentro da boca
Os cânceres dos lábios e da cavidade oral matam quase duzentas mil pessoas no mundo todo a cada ano, com centenas de milhares de novos casos, e o peso é especialmente grande em países de baixa e média renda. Tabaco, álcool e o hábito de mascar noz de areca são grandes responsáveis pelo risco, e homens e adultos mais velhos são particularmente afetados. O diagnóstico precoce melhora muito a sobrevida, mas em muitas regiões é difícil ter acesso a um especialista, e os exames bucais de rotina dependem do olhar e da experiência do dentista. Isso significa que manchas sutis ou áreas ásperas podem passar despercebidas, ou profissionais diferentes podem discordar sobre o que veem. Uma forma de baixo custo e amplamente disponível de registrar e revisar o interior da boca poderia fazer uma diferença real.
Transformando smartphones em ferramentas de triagem
O projeto SMART‑OM propôs capturar imagens de alta qualidade da cavidade oral em cenários comunitários do mundo real usando apenas dois smartphones comuns, um Android e um iPhone. Agentes comunitários de saúde e dentistas no sul da Índia visitaram residências e acampamentos odontológicos, recrutando adultos que concordaram em ser examinados. Para cada participante, foram fotografadas oito vistas padrão, cobrindo língua, bochechas, lábios e arcos dentários superior e inferior. Houve cuidado em usar principalmente luz natural, posicionar a câmera a apenas alguns centímetros de distância e empregar ferramentas simples, como espelhos bucais ou palitos de madeira, para segurar suavemente as bochechas e os lábios para o lado. Fotos borradas ou mal iluminadas foram repetidas, e toda a coleta de dados seguiu regras éticas rigorosas, com rostos mantidos fora do quadro e detalhes pessoais totalmente anonimizados.
Das fotos brutas a dados ricos e rotulados
No total, a equipe reuniu 2.469 imagens de 331 pessoas. Cada imagem foi colocada em um dos quatro grupos: tecido completamente saudável; variações inofensivas em relação ao aspecto habitual; distúrbios potencialmente malignos que podem evoluir para câncer; e câncer oral confirmado. Cirurgiões-dentistas especialistas foram além das etiquetas simples ao traçarem contornos detalhados nas imagens usando uma ferramenta de anotação de código aberto. Algumas versões marcam apenas a principal região de interesse, outras mapeiam toda estrutura visível, e versões focadas em lesões traçam manchas e crescimentos suspeitos. Junto com as imagens, o conjunto de dados incluiu arquivos de planilha listando o que cada região desenhada representa e tabelas separadas descrevendo idade, sexo, hábitos como fumar ou mascar fumo de betel, e achados clínicos de cada pessoa. Essa combinação de visuais e contexto foi projetada para apoiar tanto sistemas de IA baseados apenas em imagem quanto multimodais.

Testando modelos de IA
Para demonstrar a utilidade do SMART‑OM, os pesquisadores treinaram vários modelos populares de deep learning, originalmente desenvolvidos para reconhecimento geral de imagens, para enfrentar duas tarefas: simplesmente distinguir imagens normais de anormais, e diferenciar entre os quatro grupos diagnósticos. Eles dividiram o conjunto de dados em partes de treino e teste e ajustaram modelos como ResNet, VGG, EfficientNet e um Vision Transformer. Apesar do conjunto ser dominado por imagens saudáveis e conter relativamente poucos casos de câncer e alto risco, o melhor modelo — uma variante relativamente compacta do ResNet — classificou corretamente cerca de nove em cada dez imagens de teste no total. Foi especialmente confiável ao reconhecer bocas saudáveis, e razoavelmente bom — embora menos consistente — em sinalizar as anormais, refletindo o desequilíbrio natural e as diferenças visuais sutis entre as categorias.
O que isso significa para o cuidado diário
Para não especialistas, a mensagem principal é que o SMART‑OM estabelece as bases para transformar um smartphone cotidiano em um auxílio para triagem precoce do câncer oral. Ao tornar público esse grande conjunto de dados cuidadosamente anotado e totalmente anonimizado, os autores oferecem a pesquisadores do mundo todo um recurso compartilhado para treinar e comparar ferramentas de IA que podem destacar regiões suspeitas, combinar sinais visuais com dados de risco de estilo de vida e ajudar a decidir quem precisa de uma avaliação mais detalhada por um dentista ou patologista. Embora a coleção atual ainda contenha relativamente poucos casos verdadeiros de câncer, ela reflete de perto o que se vê nas comunidades e irá crescer ao longo do tempo. À medida que se expande, o SMART‑OM está pronto para apoiar verificações mais precisas, acessíveis e econômicas de alterações perigosas na boca, potencialmente salvando vidas por meio de diagnósticos mais precoces.
Citação: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5
Palavras-chave: câncer bucal, imagens por smartphone, IA médica, lesões orais, conjunto de dados para triagem