Clear Sky Science · pt

WCT-Net: restauração conjunta de murais de túmulos baseada em convolução por wavelet e rede colaborativa com autoatenção Transformer

· Voltar ao índice

Por que salvar pinturas murais antigas precisa de novas ferramentas

Por toda a China, túmulos antigos abrigam pinturas murais que estão desmoronando, rachadas e descascando nas bordas. Esses murais registram cenas da vida real, crenças e técnicas artísticas que não podemos mais testemunhar diretamente. Mas muitos fragmentos estão tão danificados que até especialistas têm dificuldade em imaginar como eram originalmente. Este estudo apresenta um novo tipo de sistema de inteligência artificial, o WCT-Net, projetado para “remendar” digitalmente essas imagens quebradas, oferecendo orientação mais segura para conservadores e visuais mais ricos para pesquisadores e o público.

Figure 1
Figure 1.

Os problemas ocultos dentro de murais danificados

Os murais de túmulos enfrentam uma dupla ameaça. Ao longo dos séculos, a umidade penetra pelo solo e pela pedra, carregando sais que se cristalizam dentro do reboco. Isso enfraquece as camadas sob a pintura, fazendo com que se desprendam, rachem e se soltem. O resultado costuma ser um pequeno fragmento sobrevivente com dois tipos de dano ao mesmo tempo: as bordas externas estão faltando, deixando a composição incompleta, e o interior está marcado pelo desbotamento, descamação e finas fissuras. A restauração manual tradicional depende de casar fragmentos e readerir com cuidado, mas quando grandes áreas desapareceram, suposições podem levar a erros ou até a novos danos. A restauração digital promete uma alternativa reversível e sem contato — mas só se os computadores conseguirem tanto inventar estruturas plausíveis quanto preservar fielmente os detalhes sobreviventes.

Por que consertos digitais anteriores ficam aquém

Os métodos computacionais anteriores aprenderam principalmente a partir de partes intactas da mesma imagem. Alguns propagavam cores e contornos vizinhos para preencher lacunas; outros copiavam e colaram trechos semelhantes de regiões preservadas. Essas ferramentas conseguem preencher defeitos como buracos definidos, mas falham quando bordas inteiras estão ausentes ou quando o assunto do mural precisa ser inferido a partir de pouco contexto. Abordagens mais recentes de aprendizado profundo, incluindo redes convolucionais e redes adversariais generativas, melhoraram o realismo, mas ainda enfrentam um compromisso: elas ou privilegiam texturas locais nítidas e perdem a visão geral, ou preservam a estrutura global em detrimento dos detalhes finos. Métodos baseados em Transformers, que se destacam em relações de longo alcance, ajudam com áreas grandes faltantes, mas ainda têm dificuldade em alinhar pequenos detalhes e formas amplas quando o dano abrange múltiplas escalas.

Um cérebro de duas vias para ver o próximo e o distante

O WCT-Net enfrenta esse problema dividindo a tarefa em dois ramos cooperativos dentro de uma rede encoder–decoder em forma de U. Um ramo usa convoluções baseadas em wavelet, uma maneira de separar a imagem em componentes suaves de baixa frequência e texturas nítidas de alta frequência. Ao aprender nessas faixas, esse ramo se especializa em preservar recursos minuciosos, como linhas finas, dobras de vestuário e sombreamentos sutis que conferem aos murais seu caráter artesanal. Em paralelo, um ramo baseado em Transformer usa autoatenção para conectar partes distantes da imagem, captando padrões de longo alcance como a pose de um cavalo ou o ritmo de uma procissão. Uma unidade de fusão aprimorada então aprende a ponderar e misturar esses dois tipos de informação para que nenhum domine: o modelo simultaneamente respeita os detalhes preservados e extrapola uma cena geral crível.

Figure 2
Figure 2.

Ensinando o sistema com danos realistas

Para treinar e testar o WCT-Net, os autores reuniram um conjunto de dados de alta qualidade de murais de túmulos imperiais do Museu de História de Shaanxi, cortando grandes fotografias em pequenos blocos de imagem. Em seguida, criaram três famílias de máscaras de dano artificiais para imitar a deterioração real: respingos e riscos aleatórios para descamação interna, perdas de borda irregulares como as causadas por pedaços de reboco que se soltam, e padrões mistos combinando ambos. O sistema aprendeu a reconstruir as imagens originais a partir dessas versões danificadas. A equipe comparou o WCT-Net com sete algoritmos líderes de restauração, usando métricas que capturam tanto a precisão estrutural quanto a naturalidade visual, e também o testou em um conjunto de murais de Dunhuang com um estilo artístico diferente.

Linhas mais nítidas, cenas mais completas e o que isso significa

Em todos os tipos de dano — desgaste interno, bordas faltantes e combinações complexas — o WCT-Net produziu restaurações que mantiveram linhas de contorno contínuas, texturas nítidas e composições gerais mais completas do que métodos concorrentes. As pontuações objetivas melhoraram em vários por cento, e as imagens geradas se aproximaram mais da percepção humana de autenticidade. Embora o modelo seja computacionalmente mais pesado que alguns rivais, seus ganhos são mais pronunciados onde os murais são mais difíceis de interpretar: quando tanto a pintura interna quanto suas bordas externas foram perturbadas. Para conservadores, isso significa uma pré-visualização digital mais confiável antes de tocar superfícies frágeis; para historiadores e o público, oferece janelas mais claras para o mundo visual do passado. Os autores observam que trabalhos futuros devem lidar melhor com estilos diversos e rodar com maior eficiência, mas o WCT-Net marca um passo significativo em direção ao uso da IA como um parceiro cuidadoso e atento ao contexto na preservação do patrimônio cultural.

Citação: Li, J., Wu, M., Lu, Z. et al. WCT-Net: joint restoration of tomb murals based on wavelet convolution and transformer self-attention collaborative network. npj Herit. Sci. 14, 151 (2026). https://doi.org/10.1038/s40494-026-02412-y

Palavras-chave: restauração digital de murais, conservação do patrimônio cultural, reconstrução de imagens, aprendizado profundo para arte, murais de túmulos antigos