Clear Sky Science · fr
WCT-Net : restauration conjointe de peintures murales funéraires basée sur la convolution par ondelettes et un réseau collaboratif d’attention par transformeur
Pourquoi sauver de vieilles peintures murales exige de nouveaux outils
À travers la Chine, des tombes anciennes abritent des peintures murales qui s’effritent, se fissurent et se décollent sur les bords. Ces fresques représentent des scènes de vie royale, de croyances et d’artisanat que nous ne pouvons plus observer directement. Mais de nombreux fragments sont si endommagés que même les spécialistes peinent à imaginer leur apparence d’origine. Cette étude présente un nouveau type de système d’intelligence artificielle, WCT-Net, conçu pour « recoudre » numériquement ces images brisées, offrant une orientation plus sûre aux restaurateurs et des visuels plus riches pour les chercheurs et le public.

Les problèmes cachés à l’intérieur des fresques endommagées
Les peintures funéraires subissent une double menace. Au fil des siècles, l’humidité s’infiltre à travers le sol et la pierre, transportant des sels qui cristallisent dans l’enduit. Cela fragilise les couches sous la peinture, provoquant détachements, fissures et chutes. Le résultat est souvent un petit fragment survivant présentant deux types de dégâts simultanément : les bords externes manquent, rendant la composition incomplète, et l’intérieur est marqué par la décoloration, l’écaillage et de fines fissures. La restauration manuelle traditionnelle repose sur l’ajustement des fragments et un recollage soigneux, mais lorsque de larges zones ont disparu, les suppositions peuvent entraîner des erreurs voire de nouveaux dommages. La restauration numérique promet une alternative réversible et sans contact — à condition que les ordinateurs puissent à la fois inventer des structures manquantes plausibles et préserver fidèlement les détails survivants.
Pourquoi les corrections numériques précédentes restent insuffisantes
Les méthodes informatiques antérieures apprenaient principalement à partir des parties intactes de la même image. Certaines étendaient les couleurs et les contours voisins dans les vides ; d’autres copiaient et collèrent des morceaux similaires depuis des régions indemnes. Ces outils peuvent combler des défauts propres en forme de trous, mais échouent lorsque des bords entiers manquent ou lorsque le sujet de la fresque doit être déduit à partir de très peu de contexte. Les approches plus récentes d’apprentissage profond, incluant les réseaux convolutifs et les réseaux antagonistes génératifs, ont amélioré le réalisme mais demeurent confrontées à un compromis : elles privilégient soit des textures locales nettes au détriment de la vision d’ensemble, soit la structure globale en estompant le travail fin du pinceau. Les méthodes basées sur les transformeurs, qui excellent dans les relations à longue portée, aident pour les grandes zones manquantes mais peinent encore à aligner petits détails et grandes formes lorsque les dommages couvrent plusieurs échelles.
Un cerveau à deux voies pour voir le proche et le lointain
WCT-Net aborde ce problème en scindant la tâche en deux branches coopérantes au sein d’un réseau en U encodeur–décodeur. Une branche utilise des convolutions basées sur les ondelettes, une façon de séparer une image en composantes lisses à basse fréquence et en textures nettes à haute fréquence. En apprenant sur ces bandes, cette branche se spécialise dans la préservation de détails infimes comme des traits de cheveux, des plis de vêtements et des ombrages subtils qui donnent aux fresques leur caractère artisanal. En parallèle, une branche basée sur un transformeur utilise l’auto-attention pour relier des parties éloignées de l’image, saisissant des motifs à longue portée tels que la posture d’un cheval ou le rythme d’une procession. Une unité de fusion améliorée apprend ensuite à pondérer et à combiner ces deux types d’informations afin qu’aucune ne domine : le modèle respecte simultanément les détails conservés et extrapole une scène globale crédible.

Enseigner au système avec des dommages réalistes
Pour entraîner et tester WCT-Net, les auteurs ont assemblé un ensemble de données de haute qualité de fresques impériales du musée d’histoire du Shaanxi, découpant de grandes photographies en plus petits pavés d’images. Ils ont ensuite créé trois familles de masques de dégradation artificiels pour imiter la détérioration réelle : des éclaboussures et rayures aléatoires pour l’écaillage intérieur, des pertes de bord irrégulières comme celles causées par des morceaux d’enduit tombés, et des motifs mixtes combinant les deux. Le système a appris à reconstruire les images d’origine à partir de ces versions endommagées. L’équipe a comparé WCT-Net à sept algorithmes de restauration de pointe, en utilisant des mesures capturant à la fois la précision structurelle et la naturalité visuelle, et l’a également testé sur un jeu de données distinct de fresques de Dunhuang présentant un style artistique différent.
Des lignes plus nettes, des scènes plus complètes, et ce que cela signifie
Pour tous les types de dommages — usure intérieure, bords manquants et combinaisons complexes — WCT-Net a produit des restaurations qui maintiennent la continuité des contours, la netteté des textures et des compositions globales plus complètes que les méthodes concurrentes. Les scores objectifs se sont améliorés de plusieurs pourcents, et les images générées correspondent davantage à la perception humaine d’authenticité. Bien que le modèle soit plus lourd en calcul que certains rivaux, ses gains sont les plus marqués là où les fresques sont les plus difficiles à interpréter : lorsque la peinture intérieure et ses limites extérieures ont toutes deux été perturbées. Pour les restaurateurs, cela signifie un aperçu numérique plus fiable avant toute intervention sur des surfaces fragiles ; pour les historiens et le public, cela offre des fenêtres plus claires sur le monde visuel du passé. Les auteurs notent que des travaux futurs devront mieux gérer la diversité des styles et améliorer l’efficacité, mais WCT-Net constitue une avancée importante pour faire de l’IA un partenaire attentif et contextuel dans la préservation du patrimoine culturel.
Citation: Li, J., Wu, M., Lu, Z. et al. WCT-Net: joint restoration of tomb murals based on wavelet convolution and transformer self-attention collaborative network. npj Herit. Sci. 14, 151 (2026). https://doi.org/10.1038/s40494-026-02412-y
Mots-clés: restauration numérique de fresques, conservation du patrimoine culturel, remplissage d’images, apprentissage profond pour l’art, fresques de tombes anciennes