Clear Sky Science · pt
Um modelo de difusão com injeção múltipla de priorização com atenção com portão para restauração de imagens da arte rupestre de Huashan
Trazer pinturas rupestres antigas de volta à vida
A arte rupestre de Zuojiang Huashan, no sul da China, é uma vasta galeria em penhascos pintada há mais de dois mil anos. Hoje, muitas dessas figuras e símbolos em ocre estão muito desbotados, rachados ou completamente ausentes. Este artigo apresenta um método digital que utiliza técnicas avançadas de geração de imagens para reparar virtualmente essas obras frágeis, objetivando apoiar a conservação cuidadosa, a pesquisa e a apreciação pública sem tocar na rocha.

Por que essas pinturas em penhascos importam
A arte rupestre de Huashan se estende ao longo de penhascos íngremes junto ao rio e representa figuras humanas agachadas, cenas rituais e outras formas simbólicas em tons vermelhos marcantes. É um dos complexos de arte rupestre mais extensos e ricos do sul da China e do Sudeste Asiático, e parte fundamental do patrimônio cultural Zhuang. Mas os pigmentos, feitos de minerais ricos em ferro, são altamente vulneráveis à chuva, ao vento, ao crescimento biológico e ao contato humano. Ao longo de séculos, isso levou a cores desbotadas, contornos quebrados, áreas descascadas e texturas gastas e ruidosas que podem ser difíceis de distinguir dos motivos pintados reais. A restauração manual tradicional é lenta, subjetiva e de difícil reprodução, tornando desafiador proteger um sítio tão grande e frágil em escala.
Como a restauração inteligente pode ajudar
A restauração digital de imagens oferece uma forma de “preencher as lacunas” virtualmente, seguindo o princípio de conservação de intervenção mínima. Em vez de repintar o penhasco, computadores inferem formas e texturas prováveis nas áreas ausentes, produzindo resultados consistentes e reversíveis que podem ser armazenados em arquivos de alta resolução, usados para estudo e compartilhados com o público por meio de exposições e experiências imersivas. Trabalhos anteriores em inteligência artificial voltados ao patrimônio cultural concentraram-se principalmente na detecção de danos ou na segmentação de motivos, ou na restauração de murais onde formas e texturas são mais regulares. A arte rupestre apresenta um desafio maior: seu significado reside em contornos sutis e poses simbólicas, enquanto suas superfícies estão fortemente desgastadas e irregulares. Um método de restauração deve respeitar as formas originais ao mesmo tempo em que completa texturas ásperas e quebradas de maneira crível, sem inventar em excesso.
Um novo conjunto de dados para superfícies rochosas desgastadas
Os autores primeiro constroem um conjunto de imagens dedicado à restauração da arte rupestre de Huashan. Eles coletam 528 imagens candidatas de atlas impressos e fontes online públicas, e depois as selecionam cuidadosamente para reter 177 que mostram claramente motivos rupestres juntamente com degradação visível, como desbotamento, descascamento e limites borrados. Todas as imagens selecionadas são convertidas para um formato de cor comum e redimensionadas para 512×512 pixels, com a região pintada principal centralizada. Para treinar e testar métodos de restauração de forma controlada, geram tríades para cada amostra: (1) uma imagem de referência limpa, (2) uma imagem de entrada onde 30–65% da área é mascarada com manchas pretas para simular dano, e (3) uma máscara indicando as regiões faltantes. Essa configuração permite avaliação objetiva, em nível de pixel, de quão bem diferentes métodos podem reconstruir a obra subjacente.

Ensinar um modelo a respeitar forma e superfície
O núcleo do artigo é uma estrutura de restauração baseada em modelos de difusão, uma classe recente de métodos generativos que transformam ruído em imagens por meio de muitos pequenos passos de denoising. Em vez de tratar todas as pistas visuais como um único pacote, os autores dividem a orientação em dois “priors” separados: um que enfatiza a estrutura (bordas e contornos tipo traço) e outro que enfatiza a textura (granulação fina e rugosidade da superfície). Esses priors são calculados a partir das partes ainda visíveis de uma imagem danificada usando filtros determinísticos e então codificados em mapas de características. Um módulo de fusão com atenção com portão decide, a cada passo de denoising, quanto confiar na orientação estrutural versus a de textura e com que intensidade injetá-las no processo de difusão. No início, o sistema se apoia mais em contornos estáveis; mais tarde, à medida que o ruído é reduzido, presta mais atenção em reconstruir detalhes de textura que combinem com a superfície rochosa circundante.
Quão bem o restaurador digital se sai
A equipe treina e testa seu método no conjunto de dados de Huashan, comparando-o com uma ampla gama de modelos de restauração de imagem existentes, desde redes clássicas codificador–decodificador até abordagens generativas avançadas e de espaço de estados. Usando medidas padrão de erro, nitidez e similaridade estrutural, o modelo deles alcança erros por pixel menores e maior concordância estrutural do que todas as linhas de base no conjunto de teste de arte rupestre. Estudos de ablação mostram que cada componente adicionado — a extração de prior em ramos duplos e a fusão com atenção com portão — contribui com ganhos claros. Comparações visuais revelam continuidade mais suave de contornos humanos e simbólicos e integração mais natural das áreas restauradas com fundos desgastados. Mapas de atenção indicam ainda que o modelo foca em limites faltantes, contornos principais dos símbolos e zonas de transição de textura, em vez de repintar cegamente grandes áreas.
O que isso significa para proteger o passado
Para não especialistas, a principal conclusão é que esse método oferece uma forma mais cautelosa e interpretável de reparar digitalmente pinturas rupestres antigas. Ao separar sinais de forma e superfície e ajustar sua influência ao longo do tempo, o modelo pode reconectar figuras quebradas e preencher áreas faltantes mantendo a aparência e a sensação material do penhasco original. Os autores enfatizam que seu sistema é uma ferramenta para auxiliar, não substituir, o julgamento de especialistas, e que são necessários dados mais diversos e avaliação especializada. Ainda assim, o trabalho aponta para um futuro em que arte rupestre ameaçada pode ser documentada, estudada e compartilhada em forma digitalmente restaurada, preservando tanto o impacto visual quanto o significado cultural sem intervenção física.
Citação: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7
Palavras-chave: restauração de arte rupestre, patrimônio cultural, modelos de difusão, reconstrução de imagens, pinturas de Huashan