Clear Sky Science · de
Ein gated-attention Multi-Prior-Injection-Diffusionsmodell zur Bildrestaurierung der Felskunst von Huashan
Alte Felsmalereien wieder zum Leben erwecken
Die Zuojiang-Huashan-Felskunst im Süden Chinas ist eine gewaltige Felsgalerie, die vor mehr als zweitausend Jahren gemalt wurde. Heute sind viele dieser ockerfarbenen Figuren und Symbole stark verblasst, rissig oder ganz verloren. Diese Arbeit stellt ein digitales Verfahren vor, das moderne bildgenerative Techniken nutzt, um diese fragilen Kunstwerke virtuell zu reparieren. Ziel ist es, konservatorische Forschung und öffentliche Vermittlung zu unterstützen, ohne den Fels selbst zu berühren.

Warum diese Felsmalereien wichtig sind
Die Huashan-Felskunst erstreckt sich entlang steiler Flussklippen und zeigt hockende Menschen, Ritualszenen und andere symbolische Formen in auffälligen Rottönen. Sie zählt zu den größten und reichhaltigsten Felskunstkomplexen Südchinas und Südostasiens und ist ein zentraler Bestandteil des Zhuang-Kulturerbes. Die Pigmente, aus eisenreichen Mineralien hergestellt, sind jedoch sehr anfällig für Regen, Wind, biologisches Wachstum und menschlichen Kontakt. Über Jahrhunderte führten diese Einflüsse zu verblassten Farben, gebrochenen Konturen, abblätternden Stellen und verrauschten, verwitterten Texturen, die schwer von den eigentlichen Motiven zu unterscheiden sind. Traditionelle manuelle Restaurierung ist langsam, subjektiv und schwer reproduzierbar, was den Schutz eines so großen, empfindlichen Ensembles erschwert.
Wie intelligente Restaurierung helfen kann
Digitale Bildrestaurierung bietet die Möglichkeit, Lücken virtuell zu „füllen“ und folgt dem konservatorischen Prinzip minimaler Intervention. Anstatt die Felswand zu übermalen, schätzen Computer wahrscheinliche Formen und Texturen in fehlenden Bereichen ab und erzeugen konsistente, reversible Ergebnisse, die in hochaufgelösten Archiven gespeichert, für Untersuchungen genutzt und über Ausstellungen oder immersive Präsentationen geteilt werden können. Frühere KI-Arbeiten im Bereich Kulturerbe konzentrierten sich meist auf Schadensdetektion, Segmentierung von Motiven oder auf die Restaurierung von Wandmalereien mit regelmäßigerer Form- und Texturstruktur. Felskunst stellt eine schwierigere Aufgabe dar: Ihre Bedeutung liegt in subtilen Konturen und symbolischen Posen, während die Oberflächen stark verwittert und unregelmäßig sind. Eine Restaurierungsmethode muss die ursprünglichen Formen respektieren und dennoch gebrochene, raue Texturen glaubwürdig, aber nicht überfunden ergänzen.
Ein neuer Datensatz für verwitterte Felsoberflächen
Die Autoren erstellen zunächst einen speziellen Bilddatensatz für die Restaurierung der Huashan-Felskunst. Sie sammeln 528 Kandidatenbilder aus gedruckten Atlanten und öffentlichen Online-Quellen und sichten diese sorgfältig, um 177 Bilder zu behalten, die klare Felskunstmotive mit sichtbaren Schäden wie Verblassung, Abblättern und unscharfen Grenzen zeigen. Alle ausgewählten Bilder werden in ein einheitliches Farbformat konvertiert und auf 512×512 Pixel skaliert, wobei die Hauptbemalung zentriert wird. Um Restaurierungsmethoden kontrolliert zu trainieren und zu testen, generieren sie für jede Probe Tripel: (1) ein sauberes Referenzbild, (2) ein Eingangsbild, bei dem 30–65 % der Fläche mit schwarzen Flecken maskiert sind, um Schäden zu simulieren, und (3) eine Maske, die die fehlenden Regionen angibt. Dieses Setup ermöglicht eine objektive, pixelgenaue Bewertung, wie gut verschiedene Methoden das zugrundeliegende Kunstwerk rekonstruieren können.

Dem Modell beibringen, Form und Oberfläche zu respektieren
Der Kern der Arbeit ist ein Restaurierungsrahmen, der auf Diffusionsmodellen aufbaut — einer jüngeren Klasse generativer Verfahren, die Rauschen in vielen kleinen Denosing-Schritten schrittweise in Bilder verwandeln. Statt alle visuellen Hinweise zusammenzufassen, teilen die Autoren die Führung in zwei getrennte „Priors“ auf: einen, der Struktur (Kanten und strichähnliche Konturen) betont, und einen, der Textur (feine Körnung und Oberflächenrauheit) betont. Diese Priors werden aus den noch sichtbaren Teilen eines beschädigten Bildes mittels deterministischer Filter berechnet und dann in Feature-Maps kodiert. Ein gated-attention-Fusionsmodul entscheidet bei jedem Denosing-Schritt, wie sehr strukturelle gegenüber texturalen Hinweisen vertraut wird und wie stark sie in den Diffusionsprozess eingespeist werden. Zu Beginn verlässt sich das System stärker auf stabile Umrisse; später, wenn das Rauschen reduziert ist, richtet es mehr Aufmerksamkeit auf die Rekonstruktion von Texturdetails, die zur umgebenden Felsoberfläche passen.
Wie gut der digitale Restaurator arbeitet
Das Team trainiert und testet seine Methode auf dem Huashan-Datensatz und vergleicht sie mit einer breiten Palette bestehender Bildrestaurierungsmodelle, von klassischen Encoder–Decoder-Netzen bis hin zu fortgeschrittenen generativen und State-Space-Ansätzen. Mit standardisierten Messgrößen für Fehler, Schärfe und strukturelle Ähnlichkeit erzielt ihr Modell niedrigere Pixel-Fehler und höhere strukturelle Übereinstimmung als alle Baselines auf dem Felskunsten-Testset. Ablationsstudien zeigen, dass jede hinzugefügte Komponente — die duale Prior-Extraktion und die gated-attention-Fusion — deutliche Verbesserungen bringt. Visuelle Vergleiche zeigen eine glattere Fortsetzung menschlicher und symbolischer Konturen und eine natürlichere Integration der restaurierten Bereiche in verwitterte Hintergründe. Aufmerksamkeitskarten deuten außerdem darauf hin, dass das Modell sich auf fehlende Grenzen, zentrale Symbolkonturen und Zonen des Texturwechsels konzentriert, statt große Flächen blind zu übermalen.
Was das für den Schutz der Vergangenheit bedeutet
Für nicht Spezialisten lautet die wichtigste Erkenntnis, dass diese Methode eine vorsichtigere und besser interpretierbare Art bietet, alte Felsmalereien digital zu reparieren. Durch die Trennung von Form- und Oberflächenhinweisen und die zeitliche Anpassung ihres Einflusses kann das Modell gebrochene Figuren verbinden und fehlende Stellen füllen, während es das Aussehen und das materielle Gefühl des ursprünglichen Felsens bewahrt. Die Autoren betonen, dass ihr System ein Werkzeug zur Unterstützung und nicht zum Ersatz fachlicher Urteile ist und dass vielfältigere Daten sowie Expertenbewertung nötig sind. Dennoch weist die Arbeit in eine Zukunft, in der bedrohte Felskunst dokumentiert, erforscht und in digital restaurierter Form geteilt werden kann, sodass sowohl visuelle Wirkung als auch kulturelle Bedeutung ohne physisches Eingreifen erhalten bleiben.
Zitation: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7
Schlüsselwörter: Restaurierung von Felskunst, kulturelles Erbe, Diffusionsmodelle, Bildinpainting, Huashan-Gemälde