Clear Sky Science · pl

Model dyfuzji z wstrzykiwaniem wieloprzyczynowym i uwagą bramkowaną do rekonstrukcji obrazów sztuki naskalnej z Huashan

· Powrót do spisu

Przywracanie do życia starożytnych malowideł na skale

Sztuka naskalna Zuojiang Huashan na południu Chin to rozległa galeria na klifach, malowana ponad dwa tysiące lat temu. Dziś wiele z tych ochrówkowych postaci i symboli jest silnie wyblakłych, spękanych lub całkowicie utraconych. Artykuł prezentuje cyfrową metodę wykorzystującą zaawansowane techniki generowania obrazów do wirtualnej naprawy tych delikatnych dzieł, mającą na celu wspieranie ostrożnej konserwacji, badań i udostępniania publicznego bez dotykania skały.

Figure 1
Figure 1.

Dlaczego te malowidła na klifach są ważne

Sztuka naskalna Huashan rozciąga się wzdłuż stromych klifów nad rzeką i przedstawia przykucnięte postacie ludzkie, sceny rytualne oraz inne formy symboliczne w uderzających czerwonych tonach. Jest to jeden z największych i najbogatszych kompleksów sztuki naskalnej w południowych Chinach i Azji Południowo-Wschodniej oraz kluczowy element dziedzictwa kulturowego Zhuangów. Jednak pigmenty, wykonane z minerałów bogatych w żelazo, są bardzo podatne na deszcz, wiatr, wzrost organizmów biologicznych i kontakt z ludźmi. Na przestrzeni wieków doprowadziło to do wyblakłych barw, zatarć konturów, łuszczących się fragmentów i szorstkich, zwietrzałych tekstur, które trudno odróżnić od rzeczywistych motywów malarskich. Tradycyjna ręczna renowacja jest powolna, subiektywna i trudna do odtworzenia, co utrudnia ochronę tak dużego, wrażliwego miejsca na szeroką skalę.

Jak inteligentna rekonstrukcja może pomóc

Cyfrowa rekonstrukcja obrazu oferuje sposób na wirtualne „wypełnianie luk”, zgodnie z zasadą konserwatorską minimalnej interwencji. Zamiast ponownego malowania klifu, komputery wnioskują prawdopodobne kształty i tekstury w brakujących obszarach, tworząc spójne, odwracalne wyniki, które można przechowywać w archiwach wysokiej rozdzielczości, wykorzystywać do badań i udostępniać publicznie poprzez wystawy i doświadczenia immersyjne. Dotychczasowe prace z użyciem sztucznej inteligencji w dziedzictwie kulturowym skupiały się głównie na wykrywaniu uszkodzeń lub segmentacji motywów albo na rekonstrukcji murali, gdzie kształty i faktury są bardziej regularne. Sztuka naskalna stanowi trudniejsze wyzwanie: jej znaczenie tkwi w subtelnych konturach i pozach symbolicznych, podczas gdy powierzchnie są mocno zwietrzałe i nieregularne. Metoda rekonstrukcji musi respektować oryginalne kształty, jednocześnie uzupełniając zniszczone, szorstkie tekstury w wiarygodny, ale nie nadmiernie wymyślony sposób.

Nowy zestaw danych dla zwietrzałych powierzchni skalnych

Autorzy najpierw stworzyli dedykowany zbiór obrazów do rekonstrukcji sztuki naskalnej Huashan. Zgromadzili 528 kandydatów z atlasów drukowanych i publicznych źródeł online, a następnie starannie przefiltrowali je, zachowując 177 obrazów, które wyraźnie pokazują motywy sztuki naskalnej wraz z widoczną degradacją, taką jak blaknięcie, łuszczenie się i rozmyte granice. Wszystkie wybrane obrazy zostały przekonwertowane do wspólnego formatu kolorystycznego i zmieniono ich rozmiar na 512×512 pikseli z głównym malowanym obszarem wyśrodkowanym. Aby trenować i testować metody rekonstrukcji w kontrolowany sposób, wygenerowali trójki dla każdego przykładu: (1) czysty obraz referencyjny, (2) obraz wejściowy, w którym 30–65% powierzchni zasłonięto czarnymi łatami, aby zasymulować uszkodzenia, oraz (3) maskę wskazującą brakujące regiony. To ustawienie pozwala na obiektywną, pikselową ocenę, jak dobrze różne metody potrafią odtworzyć ukryte dzieło.

Figure 2
Figure 2.

Nauka modelu szacunku kształtu i powierzchni

Rdzeń artykułu to ramy rekonstrukcji oparte na modelach dyfuzyjnych, nowej klasie metod generatywnych, które stopniowo przekształcają szum w obrazy poprzez wiele małych kroków odszumiających. Zamiast traktować wszystkie wskazówki wizualne jako jedną całość, autorzy rozdzielili sterowanie na dwa oddzielne „priory”: jeden podkreślający strukturę (krawędzie i kontury przypominające pociągnięcia), a drugi akcentujący fakturę (drobne ziarno i chropowatość powierzchni). Priory te są obliczane z nadal widocznych części uszkodzonego obrazu za pomocą deterministycznych filtrów, a następnie kodowane do map cech. Moduł fuzji z bramkowaną uwagą decyduje w każdym kroku odszumiania, na ile ufać wskazaniom struktury względem tekstury i jak silnie wtrącać je do procesu dyfuzji. Na początku system bardziej opiera się na stabilnych obrysach; później, w miarę redukcji szumu, zwraca większą uwagę na odtwarzanie szczegółów tekstury zgodnych z otaczającą powierzchnią skały.

Jak dobrze działa cyfrowy restaurator

Zespół trenował i testował swoją metodę na zbiorze Huashan, porównując ją z szerokim spektrum istniejących modeli rekonstrukcji obrazów, od klasycznych sieci enkoder–dekoder po zaawansowane podejścia generatywne i bazujące na przestrzeni stanu. Przy użyciu standardowych miar błędu, ostrości i podobieństwa strukturalnego ich model osiągnął niższe błędy na poziomie piksela i wyższe zgodności strukturalne niż wszystkie porównywane metody bazowe na zestawie testowym sztuki naskalnej. Badania ablacjne wykazują, że każdy dodany składnik — ekstrakcja priory w dwóch gałęziach oraz fuzja z bramkowaną uwagą — wnosi wyraźne korzyści. Porównania wizualne ukazują płynniejsze kontynuacje konturów postaci i symboli oraz bardziej naturalną integrację zrekonstruowanych obszarów z zwietrzałymi tłami. Mapy uwagi dodatkowo wskazują, że model koncentruje się na brakujących granicach, kluczowych obrysach symboli i strefach przejścia tekstury, zamiast bezmyślnie przemalowywać duże powierzchnie.

Co to oznacza dla ochrony przeszłości

Dla osób niebędących specjalistami główny wniosek jest taki, że metoda ta oferuje bardziej ostrożny i interpretowalny sposób cyfrowej naprawy starożytnych malowideł skalnych. Dzięki rozdzieleniu wskazówek dotyczących kształtu i powierzchni oraz regulowaniu ich wpływu w czasie, model może ponownie połączyć przerwane postacie i wypełnić brakujące fragmenty, zachowując jednocześnie wygląd i materialne wrażenie oryginalnego klifu. Autorzy podkreślają, że ich system jest narzędziem wspomagającym, a nie zastępującym ekspertyzę, oraz że potrzebne są bardziej zróżnicowane dane i ocena ekspertów. Mimo to praca wskazuje na przyszłość, w której zagrożone malowidła naskalne mogą być dokumentowane, badane i udostępniane w cyfrowo zrekonstruowanej formie, zachowując zarówno efekt wizualny, jak i znaczenie kulturowe bez interwencji fizycznej.

Cytowanie: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

Słowa kluczowe: konserwacja sztuki naskalnej, dziedzictwo kulturowe, modele dyfuzyjne, uzupełnianie obrazów, malowidła z Huashan