Clear Sky Science · sv

WCT-Net: gemensam restaurering av gravmålningar baserat på vågkonvolutions- och transformer-självuppmärksamhets-samarbetsnätverk

· Tillbaka till index

Varför räddning av gamla väggmålningar kräver nya verktyg

I hela Kina finns forntida gravar med väggmålningar som smular, spricker och flagar vid kanterna. Dessa målningar skildrar scener ur hovlivet, trosföreställningar och konstnärligt uttryck som vi inte längre kan bevittna på plats. Men många fragment är så förstörda att även experter har svårt att föreställa sig hur de en gång såg ut. Denna studie presenterar en ny typ av artificiell intelligens, WCT-Net, skapad för att digitalt ”lappa ihop” dessa skadade bilder och erbjuda säkrare vägledning för konservatorer samt rikare visuella tolkningar för forskare och allmänheten.

Figure 1
Figure 1.

De dolda problemen i skadade målningar

Gravmålningar utsätts för en dubbel hotbild. Under århundraden tränger fukt in genom jord och sten och för med sig salter som kristalliseras i putsen. Det försvagar lagren under färgen och får sektioner att lossa, spricka och falla bort. Resultatet är ofta ett litet bevarat fragment med två skadetyper samtidigt: de yttre kanterna saknas så helhetskompositionen är ofullständig, och innanmätet är märkt av blekning, flagning och fina sprickor. Traditionell manuell restaurering bygger på att para ihop fragment och varsamt återfästa dem, men när stora områden saknas kan gissningar leda till fel eller till och med ny skada. Digital restaurering lovar ett reversibelt, icke-kontakt sätt—men endast om datorer både kan återskapa rimliga saknade strukturer och troget bevara det som finns kvar.

Varför tidigare digitala lösningar inte räcker

Tidigare datorbaserade metoder lärde sig mest från oskadade delar av samma bild. Vissa spred närliggande färger och kanter in i hålen; andra kopierade och klistrade in liknande fläckar från intakta områden. Dessa verktyg kan fylla prydliga, hål-liknande defekter, men de misslyckas när hela gränser saknas eller när motivet måste härledas ur mycket liten kontext. Nyare djuplärande angreppssätt, inklusive konvolutionella neurala nätverk och generativa adversariella nätverk, förbättrade realism men står fortfarande inför en kompromiss: de prioriterar antingen skarp lokal textur på bekostnad av helhetsbilden, eller bevarar global struktur men suddar ut fin penselföring. Transformatorbaserade metoder, som är bra på långdistansrelationer, hjälper vid stora förluster men har fortfarande svårt att förena små detaljer med stora former när skadan spänner över flera skalor.

Ett tvåspårigt sinne för att se både nära och långt

WCT-Net tacklar detta genom att dela upp uppgiften i två samverkande grenar inom ett U-format encoder–decoder-nätverk. En gren använder vågkonvolutionsbaserade operationer, ett sätt att dela upp bilden i jämna, låg-frekventa komponenter och skarpa, högfrekventa texturer. Genom att lära på dessa band specialiserar sig denna gren på att bevara små detaljer som hårstrån, veck i klädnader och subtil skuggning som ger målningarna deras hantverksmässiga karaktär. Parallellt använder en transformerbaserad gren självuppmärksamhet för att koppla avlägsna delar av bilden och fånga långväga mönster som en hästs hållning eller rytmen i ett processionståg. En förbättrad fusionenhet lär sig sedan hur dessa två informationsslag ska vägas och blandas så att ingen dominerar: modellen hedrar samtidigt överlevande detaljer och extrapolerar en trovärdig helhet.

Figure 2
Figure 2.

Att lära systemet med realistiska skador

För att träna och testa WCT-Net sammanställde författarna en högkvalitativ datamängd med kejserliga gravmålningar från Shaanxi History Museum, där stora fotografier delades upp i mindre bildlappar. De skapade sedan tre familjer av konstgjorda skademasker för att efterlikna verklig förfall: slumpmässiga fläckar och repor för inre flagning, oregelbundna kantförluster som orsakats av att bitar av putsen lossnat, och blandade mönster som kombinerar båda. Systemet lärde sig rekonstruera originalbilderna från dessa skadade versioner. Teamet jämförde WCT-Net med sju ledande restaureringsalgoritmer med mått som fångar både strukturell noggrannhet och visuell naturlighet, och testade det också på en separat Dunhuang-datamängd med en annan konstnärlig stil.

Skarpare linjer, fylligare scener och vad det betyder

Över alla skadetyper—inre nötning, saknade kanter och komplexa kombinationer—producerade WCT-Net restaureringar som höll konturlinjer kontinuerliga, texturer skarpa och helhetskompositioner mer fullständiga än konkurrerande metoder. Objektiva mått förbättrades med flera procent och de genererade bilderna matchade mänsklig uppfattning av äkthet bättre. Även om modellen är beräkningsmässigt tyngre än vissa rivaler är vinsterna mest uttalade där målningarna är svårast att tolka: när både den inre målningen och dess yttre gränser har störts. För konservatorer innebär detta en mer pålitlig digital förhandsvisning innan man rör vid sköra ytor; för historiker och allmänheten erbjuder det klarare fönster in i det förflutna. Författarna noterar att framtida arbete måste hantera större stilvariationer och köra mer effektivt, men WCT-Net utgör ett betydande steg mot att använda AI som en varsam, kontextmedveten partner i bevarandet av kulturarv.

Citering: Li, J., Wu, M., Lu, Z. et al. WCT-Net: joint restoration of tomb murals based on wavelet convolution and transformer self-attention collaborative network. npj Herit. Sci. 14, 151 (2026). https://doi.org/10.1038/s40494-026-02412-y

Nyckelord: digital muralrestaurering, bevarande av kulturarv, bildinpaintning, djuplärande för konst, forntida gravmålningar