Clear Sky Science · pt

Segmentação semântica de nuvens de pontos faciais de Buda por meio de crescimento de regiões guiado por conhecimento

· Voltar ao índice

Lendo o Rosto da História

As estátuas de Buda esculpidas em penhascos e paredes de templos são mais do que belas obras de arte — são registros tridimensionais de crenças religiosas, modas artísticas e intercâmbios culturais ao longo dos séculos. Este estudo mostra como cientistas da computação e especialistas em patrimônio podem “ler” esses rostos de pedra em detalhe, separando automaticamente olhos, nariz, boca e outras feições a partir de medições 3D densas, mesmo quando não há rótulos de exemplo para aprender. O objetivo é transformar a pedra silenciosa em dados mensuráveis que ajudem historiadores a comparar estilos, acompanhar mudanças ao longo do tempo e planejar conservação cuidadosa.

Por que Rostos Digitais Importam

Em locais famosos como Dunhuang, Yungang e Longmen, os rostos de Buda variam sutilmente por dinastia e região — alguns mais cheios, outros mais alongados, alguns com olhos mais suaves ou narizes mais proeminentes. Tradicionalmente, historiadores da arte descrevem essas diferenças a olho; agora, varreduras 3D de alta precisão capturam a superfície das estátuas como milhões de pontos no espaço. Porém, essas “nuvens de pontos” são desordenadas: não têm cor ou textura e não indicam automaticamente onde os olhos terminam e as bochechas começam. Métodos automáticos existentes ou exigem muitos exemplos rotulados manualmente, os quais simplesmente não existem para estátuas do patrimônio, ou dividem superfícies puramente pela geometria, ignorando as regras escultóricas que os artistas realmente seguiram.

Figure 1
Figure 1.

Ensinando Regras do Rosto aos Algoritmos

Em vez de tentar aprender a partir de dados escassos, os autores partem do conhecimento que os próprios escultores usavam. Manuais budistas tradicionais descrevem proporções faciais padrão, como dividir o rosto em terços iguais para testa, nariz e queixo, e manter as feições simétricas em torno de um eixo central. Os pesquisadores traduzem esse saber cultural e anatômico em regras geométricas simples: um plano de simetria no meio; uma linha vertical que percorre o centro do nariz; e razões que relacionam posições e tamanhos de olhos, nariz, boca, orelhas e queixo. Essas regras não são moldes rígidos: incluem parâmetros ajustáveis para que rostos mais cheios do estilo Tang e rostos mais esguios do estilo Song se encaixem em uma estrutura flexível, porém reconhecível.

Crescendo Regiões a Partir de Sementes

Partindo de uma varredura 3D limpa, o método primeiro alinha o rosto de Buda para que ele olhe para frente, depois projeta a superfície em uma grade quadrada, transformando a forma 3D em algo parecido com um mapa de alturas sombreado. Dentro dessa grade, o algoritmo escolhe posições iniciais “sementes” para cada feição facial, auxiliado pelas regras prévias: a semente do nariz fica próxima à linha vertical central e a um ponto alto local, os olhos são colocados em picos simétricos de cada lado, a boca fica abaixo do nariz em um vazio raso, e assim por diante. A partir de cada semente, o computador “faz crescer” uma região para fora, adicionando células vizinhas apenas quando sua altura e inclinação correspondem ao que se espera, por exemplo, de um dorso nasal em vez de uma bochecha. Etapas adicionais limpam o resultado, removendo pedaços soltos, preenchendo pequenas lacunas e suavizando contornos para que olhos, lábios e queixo segmentados pareçam contínuos e plausíveis tanto para o computador quanto para um especialista humano.

Colocando o Método à Prova

A equipe testou sua abordagem em quinze rostos de Buda — nove modelos sintéticos com formas controladas e seis varreduras reais de renomados sítios do patrimônio chinês. Eles mediram a qualidade pela sobreposição das regiões segmentadas automaticamente com contornos cuidadosamente desenhados à mão por especialistas e pela proximidade entre os limites computados e os contornos dos peritos. Entre olhos, sobrancelhas, orelhas, nariz, boca e queixo, o método alcançou pontuações altas, significando que a maior parte dos pontos foi corretamente atribuída à feição certa. Importante, os resultados se mantiveram estáveis across diferentes estilos de escultura e níveis de desgaste da superfície. Quando os autores compararam sua abordagem a um modelo popular de deep learning treinado com apenas alguns exemplos rotulados, a rede faminta por dados teve grande dificuldade, enquanto o método guiado por conhecimento permaneceu preciso sem precisar de grandes conjuntos de treinamento.

Figure 2
Figure 2.

O Que Isso Significa para o Patrimônio

Ao codificar as regras tradicionais de medição dos escultores em um algoritmo moderno, este estudo mostra que computadores podem segmentar rostos de Buda em 3D com pouco ou nenhum rótulo manual, ao mesmo tempo em que respeitam a lógica cultural da obra original. Para historiadores, isso abre a porta para comparações sistemáticas e quantitativas de estilos faciais entre sítios e períodos; para conservadores, oferece uma forma precisa de monitorar danos ou orientar restaurações digitais. Em essência, o método transforma convenções centenárias sobre o rosto ideal do Buda em uma ferramenta prática para ler, preservar e compreender os rostos de pedra que vigiaram templos e grutas por mais de mil anos.

Citação: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

Palavras-chave: digitalização 3D de estátuas de Buda, digitalização do patrimônio cultural, segmentação de nuvem de pontos, proporções faciais na arte, algoritmos guiados por conhecimento