Clear Sky Science · fr

Un modèle de diffusion avec injection multi-prior et attention à verrou pour la restauration d'images de l’art rupestre de Huashan

· Retour à l’index

Redonner vie aux peintures rupestres anciennes

Les peintures rupestres de Zuojiang Huashan, dans le sud de la Chine, forment une vaste galerie sur falaise, réalisées il y a plus de deux mille ans. Aujourd’hui, nombre de ces figures et symboles ocre sont fortement délavés, fissurés ou partiellement disparus. Cet article présente une méthode numérique qui exploite des techniques avancées de génération d’images pour réparer virtuellement ces œuvres fragiles, dans le but de soutenir une conservation attentive, la recherche et l’appréciation du public sans toucher à la roche elle‑même.

Figure 1
Figure 1.

Pourquoi ces peintures de falaise sont importantes

L’art rupestre de Huashan s’étend le long de falaises abruptes au bord du fleuve et représente des personnages accroupis, des scènes rituelles et d’autres formes symboliques en tons rouges saisissants. Il constitue l’un des ensembles d’art rupestre les plus vastes et riches du sud de la Chine et de l’Asie du Sud-Est, et une composante majeure du patrimoine culturel zhuang. Mais les pigments, issus de minéraux ferreux, sont très vulnérables à la pluie, au vent, aux proliférations biologiques et au contact humain. Au fil des siècles, cela a entraîné des couleurs délavées, des contours effrités, des éclats et des textures altérées par le temps qui peuvent être difficiles à distinguer des motifs peints d’origine. La restauration manuelle traditionnelle est lente, subjective et difficile à reproduire, rendant la protection d’un site aussi vaste et fragile très délicate à grande échelle.

Comment la restauration intelligente peut aider

La restauration d’images numérique offre un moyen de « combler les lacunes » virtuellement, en suivant le principe de conservation d’intervention minimale. Plutôt que de repeindre la falaise, des algorithmes infèrent les formes et textures probables dans les zones manquantes, produisant des résultats cohérents et réversibles qui peuvent être archivés en haute résolution, utilisés pour l’étude et partagés avec le public via des expositions ou des expériences immersives. Les travaux antérieurs d’intelligence artificielle appliqués au patrimoine culturel se sont surtout concentrés sur la détection de dommages ou la segmentation de motifs, ou sur la restauration de fresques où formes et textures sont plus régulières. L’art rupestre représente un défi plus exigeant : son sens repose sur des contours subtils et des poses symboliques, alors que les surfaces sont fortement altérées et irrégulières. Une méthode de restauration doit respecter les formes originales tout en complétant des textures rugueuses et fragmentées de façon crédible, sans trop inventer.

Un nouveau jeu de données pour surfaces rocheuses altérées

Les auteurs construisent d’abord un jeu de données dédié à la restauration des peintures de Huashan. Ils collectent 528 images candidates à partir d’atlas imprimés et de sources publiques en ligne, puis les filtrent soigneusement pour retenir 177 images montrant clairement des motifs rupestres avec des dégradations visibles comme délavage, écaillage et contours flous. Toutes les images sélectionnées sont converties dans un format colorimétrique commun et redimensionnées à 512×512 pixels, la région peinte principale étant centrée. Pour entraîner et tester les méthodes de restauration de manière contrôlée, ils génèrent des triplets pour chaque échantillon : (1) une image de référence propre, (2) une image d’entrée où 30–65 % de la surface est masquée par des patches noirs pour simuler des dommages, et (3) un masque indiquant les zones manquantes. Ce dispositif permet une évaluation objective, au niveau pixel, de la qualité de reconstruction des différentes méthodes.

Figure 2
Figure 2.

Apprendre au modèle à respecter forme et surface

Le cœur de l’article est un cadre de restauration fondé sur des modèles de diffusion, une classe récente de méthodes génératives qui transforment progressivement du bruit en images par de nombreuses petites étapes de débruitage. Plutôt que de traiter tous les indices visuels comme un seul ensemble, les auteurs séparent l’information de guidage en deux « priors » distincts : l’un mettant l’accent sur la structure (arêtes et contours type traits), et l’autre sur la texture (granularité fine et rugosité de surface). Ces priors sont calculés à partir des parties encore visibles d’une image endommagée à l’aide de filtres déterministes puis encodés en cartes de caractéristiques. Un module de fusion par attention à verrou décide, à chaque étape de débruitage, combien faire confiance au guidage structurel versus textural et avec quelle intensité les injecter dans le processus de diffusion. En phase initiale, le système s’appuie davantage sur des contours stables ; plus tard, à mesure que le bruit diminue, il accorde plus d’attention à la reconstruction des détails de texture compatibles avec la surface rocheuse environnante.

Performance du restaurateur numérique

L’équipe entraîne et évalue sa méthode sur le jeu de données de Huashan, en la comparant à un large éventail de modèles de restauration d’images existants, depuis des réseaux encodeur‑décodeur classiques jusqu’à des approches génératives avancées et basées sur des espaces d’état. En utilisant des mesures standards d’erreur, de netteté et de similarité structurelle, leur modèle obtient des erreurs au niveau pixel plus faibles et une meilleure concordance structurelle que toutes les méthodes de référence sur le jeu de test d’art rupestre. Des études d’ablation montrent que chaque composant ajouté — l’extraction prior à double branche et la fusion par attention à verrou — apporte un gain net. Les comparaisons visuelles révèlent une continuité plus fluide des contours humains et symboliques et une intégration plus naturelle des zones restaurées avec les arrière‑plans altérés. Les cartes d’attention indiquent en outre que le modèle se concentre sur les limites manquantes, les contours clés des symboles et les zones de transition de texture, plutôt que de repeindre aveuglément de larges surfaces.

Ce que cela signifie pour la protection du passé

Pour le grand public, la conclusion principale est que cette méthode propose une façon plus prudente et interprétable de réparer numériquement des peintures rupestres anciennes. En séparant les indices de forme et de surface et en modulant leur influence au fil du temps, le modèle peut reconnecter des figures brisées et combler des lacunes tout en préservant l’aspect et la sensation matérielle de la falaise d’origine. Les auteurs insistent sur le fait que leur système est un outil d’aide à la décision, et non un substitut au jugement d’experts, et que des données plus diversifiées et des évaluations par des spécialistes restent nécessaires. Néanmoins, ce travail ouvre la voie à un avenir où l’art rupestre menacé peut être documenté, étudié et partagé sous forme numériquement restaurée, préservant à la fois l’impact visuel et la signification culturelle sans intervention physique.

Citation: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

Mots-clés: restauration de l’art rupestre, patrimoine culturel, modèles de diffusion, recomposition d’images, peintures de Huashan