Clear Sky Science · pt

Uma abordagem baseada em YOLOv12 para detecção automática de marcos cefalométricos em radiografias laterais 2D do crânio

2026-03-10 · Voltar ao índice

Por que identificar pontos minúsculos em radiografias do crânio é importante

Quando um ortodontista planeja aparelhos, cirurgia da mandíbula ou tratamentos para assimetrias faciais, ele se apoia em medidas detalhadas obtidas a partir de radiografias laterais da cabeça. Essas medidas dependem de dezenas de pontos de referência anatômicos minúsculos espalhados pelo crânio e pelo rosto. Hoje, muitos desses pontos ainda são marcados manualmente, um processo lento e relativamente subjetivo. Este estudo investiga como um sistema moderno de inteligência artificial (IA) — uma versão avançada da popular família de detectores de imagem YOLO — pode localizar automaticamente esses marcos-chave em radiografias do crânio, com o objetivo de tornar o atendimento ortodôntico mais rápido, consistente e acessível.

Do traçado cuidadoso à orientação automatizada

Por quase um século, a “análise cefalométrica” tem sido a base do diagnóstico ortodôntico. Os clínicos observam uma radiografia lateral padronizada e marcam pontos específicos no crânio e nos tecidos moles — na mandíbula, dentes, nariz, lábios e base do crânio. A partir dessas coordenadas, calculam ângulos e distâncias que orientam as decisões de tratamento. Fazer isso manualmente pode levar de 10 a 15 minutos por radiografia, e até especialistas experientes podem discordar por alguns milímetros, o que pode afetar planos de tratamento delicados. À medida que consultórios atendem mais pacientes e buscam precisão cada vez maior, cresce a pressão para acelerar esse trabalho e reduzir a variabilidade humana sem perder a supervisão profissional.

Como a IA moderna interpreta uma radiografia

O progresso recente em IA, especialmente em aprendizado profundo, transformou a forma como computadores interpretam imagens. Em vez de serem programadas com regras manuais, redes neurais profundas aprendem diretamente a partir de grandes coleções de exemplos rotulados. Em imagem médica, uma classe de modelos chamada redes neurais convolucionais se destacou, pois é capaz de descobrir automaticamente padrões que vão de bordas simples a formas anatômicas complexas. Nesse contexto, a família “You Only Look Once” ou YOLO se sobressai por detectar objetos muito rapidamente e em uma única passagem sobre a imagem. A geração mais recente, YOLOv12, incorpora mecanismos de atenção e processamento em múltiplas escalas que são especialmente úteis para encontrar estruturas pequenas e próximas umas das outras, como os marcos cefalométricos.

Construindo um localizador de marcos mais inteligente

Os autores combinaram duas coleções públicas de radiografias laterais do crânio, totalizando pouco menos de 500 imagens, cada uma anotada com 19 marcos cefalométricos importantes por clínicos experientes. Eles converteram as imagens para um formato mais compacto e transformaram cada coordenada de marco em uma pequena “caixa” quadrada centrada no ponto, de modo que o YOLOv12 — projetado para detectar objetos como caixas — pudesse tratar cada marco como um alvo minúsculo. Usando uma plataforma chamada Roboflow, removeram imagens duplicadas e aplicaram transformações moderadas, como pequenas rotações, variações de brilho e adição de ruído. Essas variações triplicaram efetivamente o número de imagens de treinamento, ajudando o modelo a ficar mais robusto a diferenças na qualidade das imagens e na anatomia dos pacientes.

Por dentro do treinamento e dos testes da IA

Os pesquisadores treinaram um grande modelo YOLOv12 em uma potente placa de vídeo por 50 rodadas de treinamento, ou épocas. Durante o treinamento, as camadas internas do modelo aprenderam a converter a radiografia bruta em um conjunto de características que destacam áreas importantes, e sua cabeça de saída aprendeu a desenhar uma pequena caixa ao redor de cada marco e atribuir-lhe uma pontuação de confiança. Terminada a fase de treinamento, o modelo foi testado em 94 radiografias que nunca havia visto antes. Para avaliar o desempenho, a equipe mediu a distância entre cada marco previsto e seu correspondente marcado por especialistas. Também examinaram curvas de precisão–recall, padrões de confusão entre diferentes marcos e gráficos detalhados mostrando concordância para pontos específicos.

O que a IA acertou — e onde teve dificuldade

No geral, o sistema encontrou cerca de metade de todos os marcos dentro de 1 milímetro das marcações de especialista, e pouco mais de 80% dentro de 2 milímetros — uma faixa considerada aceitável para muitas tarefas clínicas. O modelo se destacou em marcos com formas claras e alto contraste, como Sela, Gnation, Menton e certos pontos relacionados a dentes, onde mais de três quartos das previsões ficaram dentro de 1 milímetro e mais de 93% dentro de 2 milímetros. O modelo também se saiu surpreendentemente bem ao distinguir agrupamentos de pontos próximos na região do queixo e dos dentes frontais, sugerindo que aprendeu relações espaciais sutis, não apenas padrões de pixels isolados. Contudo, teve dificuldade com marcos em regiões mais borradas, como Gônio, Subspinale, Orbitale, Articulare e Porion. Essas áreas são desafiadoras mesmo para humanos porque ossos sobrepostos e baixo contraste tornam os limites pouco nítidos, e baixa qualidade da radiografia degradou ainda mais a acurácia.

O que isso significa para o futuro do cuidado ortodôntico

Os autores concluem que seu sistema baseado em YOLOv12 ainda não está pronto para substituir especialistas humanos, mas constitui uma forte prova de conceito para análise cefalométrica semiautomática. Na prática, tal ferramenta poderia posicionar rapidamente marcos preliminares que os clínicos ajustariam em seguida, mesclando a velocidade e consistência da IA com o julgamento profissional. Com conjuntos de dados de treinamento maiores e mais diversos, melhor tratamento de imagens de baixa qualidade e refinamentos contínuos do modelo, versões futuras poderiam alcançar desempenho de nível clínico. Se isso acontecer, ortodontistas poderão em breve gastar menos tempo traçando radiografias manualmente e mais tempo usando essas medições para elaborar planos de tratamento personalizados.

Citação: Akre, P.D., Ghavghave, Y.G. & Pacharaney, U. A YOLOv12-based approach for automatic detection of cephalometric landmarks on 2D lateral skull X-ray images. Sci Rep 16, 12837 (2026). https://doi.org/10.1038/s41598-026-43250-z

Palavras-chave: análise cefalométrica, imagem ortodôntica, aprendizado profundo, detecção de marcos, YOLOv12