Clear Sky Science · sv

En gated-attention multi-prior-injektions-diffusionsmodell för bildrestaurering av Huashan-klippkonst

· Tillbaka till index

Att återge forntida klippmålningar liv

Zuojiang Huashan-klippkonsten i södra Kina är ett omfattande klippgalleri som målades för mer än tvåtusen år sedan. Idag är många av dessa ockrafärgade figurer och symboler kraftigt utblekta, spruckna eller helt försvunna. Denna artikel presenterar en digital metod som använder avancerade bildgenereringstekniker för att virtuellt reparera dessa bräckliga konstverk, med målet att stödja varsam konservering, forskning och allmän uppskattning utan fysisk beröring av berget.

Figure 1
Figure 1.

Varför dessa klippmålningar är viktiga

Huashan-klippkonsten sträcker sig längs branta flodklippor och avbildar hukande människogestalter, rituella scener och andra symboliska former i markanta röda toner. Det är ett av de största och rikaste klippkonstkomplexen i södra Kina och Sydostasien, och en central del av zhuang-kulturarvet. Pigmenten, framställda av järnrika mineraler, är dock mycket känsliga för regn, vind, biologisk påväxt och mänsklig kontakt. Under århundraden har detta lett till utblekta färger, brutna konturer, flagande partier och brusiga, väderbitna texturer som kan vara svåra att skilja från de faktiska målningsmotiven. Traditionell manuell restaurering är långsam, subjektiv och svår att reproducera, vilket gör det utmanande att skydda en så stor och känslig plats i skala.

Hur intelligent restaurering kan hjälpa

Digital bildrestaurering erbjuder ett sätt att virtuellt ”fylla i luckor” i linje med konserveringsprincipen om minimal intervention. Istället för att måla om klippan försöker datorer sluta upp troliga former och texturer i saknade områden, vilket ger konsekventa och reversibla resultat som kan lagras i högupplösta arkiv, användas för studier och delas med allmänheten genom utställningar och immersiva upplevelser. Tidigare AI-arbete inom kulturarv har främst fokuserat på att upptäcka skador eller segmentera motiv, eller på att restaurera muralmålningar där former och texturer är mer regelbundna. Klippkonst är en större utmaning: dess betydelse ligger i subtila konturer och symboliska poser, samtidigt som ytorna är kraftigt väderbitna och oregelbundna. En restaureringsmetod måste respektera de ursprungliga formerna samtidigt som den kompletterar grova, brutna texturer på ett trovärdigt men inte överuppfunnet sätt.

En ny dataset för väderbitna klippy tor

Författarna bygger först upp en dedikerad bilddataset för Huashan-klippkonstrestaurering. De samlar 528 kandidatbilder från tryckta atlaser och offentliga källor på nätet, och gallrar dem noggrant till 177 som tydligt visar klippkonstmotiv med synlig degradering såsom utblekning, flagning och suddiga gränser. Alla valda bilder konverteras till ett gemensamt färgformat och ändras till 512×512 pixlar, med huvudmotivets målade område centrerat. För att träna och testa restaureringsmetoder i en kontrollerad miljö genererar de tripletter för varje prov: (1) en ren referensbild, (2) en ingångsbild där 30–65 % av ytan maskeras med svarta fält för att efterlikna skada, och (3) en mask som anger de saknade regionerna. Denna uppställning möjliggör objektiv, pixelbaserad utvärdering av hur väl olika metoder kan återskapa det underliggande konstverket.

Figure 2
Figure 2.

Att lära en modell att respektera form och yta

Kärnan i artikeln är en restaureringsram byggd på diffusionsmodeller, en nyare klass av generativa metoder som gradvis förvandlar brus till bilder genom många små avbrusningssteg. Istället för att behandla alla visuella ledtrådar som en enda enhet delar författarna upp vägledningen i två separata ”priors”: en som betonar struktur (kanter och penseldragsliknande konturer) och en som betonar textur (fin kornighet och ytråhet). Dessa priors beräknas från de fortfarande synliga delarna av en skadad bild med deterministiska filter och kodas sedan till featurekartor. En gated attention-fusionsmodul avgör i varje avbrusningssteg hur mycket den ska lita på strukturell respektive texturvägledning och hur starkt dessa ska injiceras i diffusionsprocessen. Tidigt i processen lutar systemet mer åt stabila konturer; senare, när bruset minskar, fokuserar det mer på att återskapa texturdetaljer som matchar den omgivande klippy tan.

Hur väl den digitala restauratören presterar

Teamet tränar och testar sin metod på Huashan-datasetet och jämför den med en mängd befintliga bildrestaureringsmodeller, från klassiska encoder–decoder-nätverk till avancerade generativa och state-space-ansatser. Med hjälp av standardmått för fel, skärpa och strukturell likhet uppnår deras modell lägre pixelbaserade fel och högre strukturellt överensstämmelse än alla jämförelsemetoder på klippkonsttestsetet. Abalationsstudier visar att varje tillagd komponent—den tvågreniga prior-extraktionen och gated attention-fusionen—bidrar med tydliga förbättringar. Visuella jämförelser visar mjukare fortsättningar av mänskliga och symboliska konturer och en mer naturlig integration av restaurerade områden med väderbitna bakgrunder. Attentionkartor indikerar dessutom att modellen fokuserar på saknade gränser, nyckelsymbolkonturer och texturövergångszoner, snarare än att blint måla om stora ytor.

Vad detta betyder för att skydda det förflutna

För icke-specialister är huvudpoängen att denna metod erbjuder ett mer försiktigt och tolkbart sätt att digitalt reparera forntida klippmålningar. Genom att separera form- och ytvinklar och justera deras inflytande över tid kan modellen återknyta brutna gestalter och fylla i saknade partier samtidigt som den bevarar det ursprungliga klippans utseende och materialkänsla. Författarna betonar att deras system är ett verktyg för att bistå, inte ersätta, experternas omdöme, och att mer varierade data och expertutvärdering krävs. Trots det pekar arbetet mot en framtid där hotad klippkonst kan dokumenteras, studeras och delas i digitalt restaurerad form, och därigenom bevara både visuellt intryck och kulturell mening utan fysisk intervention.

Citering: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

Nyckelord: restaurering av klippkonst, kulturarv, diffusionsmodeller, bildinpaintning, Huashan-målningar