Clear Sky Science · pl
Model dyfuzji z wstrzykiwaniem wieloprzyczynowym i uwagą bramkowaną do rekonstrukcji obrazów sztuki naskalnej z Huashan
Przywracanie do życia starożytnych malowideł na skale
Sztuka naskalna Zuojiang Huashan na południu Chin to rozległa galeria na klifach, malowana ponad dwa tysiące lat temu. Dziś wiele z tych ochrówkowych postaci i symboli jest silnie wyblakłych, spękanych lub całkowicie utraconych. Artykuł prezentuje cyfrową metodę wykorzystującą zaawansowane techniki generowania obrazów do wirtualnej naprawy tych delikatnych dzieł, mającą na celu wspieranie ostrożnej konserwacji, badań i udostępniania publicznego bez dotykania skały.

Dlaczego te malowidła na klifach są ważne
Sztuka naskalna Huashan rozciąga się wzdłuż stromych klifów nad rzeką i przedstawia przykucnięte postacie ludzkie, sceny rytualne oraz inne formy symboliczne w uderzających czerwonych tonach. Jest to jeden z największych i najbogatszych kompleksów sztuki naskalnej w południowych Chinach i Azji Południowo-Wschodniej oraz kluczowy element dziedzictwa kulturowego Zhuangów. Jednak pigmenty, wykonane z minerałów bogatych w żelazo, są bardzo podatne na deszcz, wiatr, wzrost organizmów biologicznych i kontakt z ludźmi. Na przestrzeni wieków doprowadziło to do wyblakłych barw, zatarć konturów, łuszczących się fragmentów i szorstkich, zwietrzałych tekstur, które trudno odróżnić od rzeczywistych motywów malarskich. Tradycyjna ręczna renowacja jest powolna, subiektywna i trudna do odtworzenia, co utrudnia ochronę tak dużego, wrażliwego miejsca na szeroką skalę.
Jak inteligentna rekonstrukcja może pomóc
Cyfrowa rekonstrukcja obrazu oferuje sposób na wirtualne „wypełnianie luk”, zgodnie z zasadą konserwatorską minimalnej interwencji. Zamiast ponownego malowania klifu, komputery wnioskują prawdopodobne kształty i tekstury w brakujących obszarach, tworząc spójne, odwracalne wyniki, które można przechowywać w archiwach wysokiej rozdzielczości, wykorzystywać do badań i udostępniać publicznie poprzez wystawy i doświadczenia immersyjne. Dotychczasowe prace z użyciem sztucznej inteligencji w dziedzictwie kulturowym skupiały się głównie na wykrywaniu uszkodzeń lub segmentacji motywów albo na rekonstrukcji murali, gdzie kształty i faktury są bardziej regularne. Sztuka naskalna stanowi trudniejsze wyzwanie: jej znaczenie tkwi w subtelnych konturach i pozach symbolicznych, podczas gdy powierzchnie są mocno zwietrzałe i nieregularne. Metoda rekonstrukcji musi respektować oryginalne kształty, jednocześnie uzupełniając zniszczone, szorstkie tekstury w wiarygodny, ale nie nadmiernie wymyślony sposób.
Nowy zestaw danych dla zwietrzałych powierzchni skalnych
Autorzy najpierw stworzyli dedykowany zbiór obrazów do rekonstrukcji sztuki naskalnej Huashan. Zgromadzili 528 kandydatów z atlasów drukowanych i publicznych źródeł online, a następnie starannie przefiltrowali je, zachowując 177 obrazów, które wyraźnie pokazują motywy sztuki naskalnej wraz z widoczną degradacją, taką jak blaknięcie, łuszczenie się i rozmyte granice. Wszystkie wybrane obrazy zostały przekonwertowane do wspólnego formatu kolorystycznego i zmieniono ich rozmiar na 512×512 pikseli z głównym malowanym obszarem wyśrodkowanym. Aby trenować i testować metody rekonstrukcji w kontrolowany sposób, wygenerowali trójki dla każdego przykładu: (1) czysty obraz referencyjny, (2) obraz wejściowy, w którym 30–65% powierzchni zasłonięto czarnymi łatami, aby zasymulować uszkodzenia, oraz (3) maskę wskazującą brakujące regiony. To ustawienie pozwala na obiektywną, pikselową ocenę, jak dobrze różne metody potrafią odtworzyć ukryte dzieło.

Nauka modelu szacunku kształtu i powierzchni
Rdzeń artykułu to ramy rekonstrukcji oparte na modelach dyfuzyjnych, nowej klasie metod generatywnych, które stopniowo przekształcają szum w obrazy poprzez wiele małych kroków odszumiających. Zamiast traktować wszystkie wskazówki wizualne jako jedną całość, autorzy rozdzielili sterowanie na dwa oddzielne „priory”: jeden podkreślający strukturę (krawędzie i kontury przypominające pociągnięcia), a drugi akcentujący fakturę (drobne ziarno i chropowatość powierzchni). Priory te są obliczane z nadal widocznych części uszkodzonego obrazu za pomocą deterministycznych filtrów, a następnie kodowane do map cech. Moduł fuzji z bramkowaną uwagą decyduje w każdym kroku odszumiania, na ile ufać wskazaniom struktury względem tekstury i jak silnie wtrącać je do procesu dyfuzji. Na początku system bardziej opiera się na stabilnych obrysach; później, w miarę redukcji szumu, zwraca większą uwagę na odtwarzanie szczegółów tekstury zgodnych z otaczającą powierzchnią skały.
Jak dobrze działa cyfrowy restaurator
Zespół trenował i testował swoją metodę na zbiorze Huashan, porównując ją z szerokim spektrum istniejących modeli rekonstrukcji obrazów, od klasycznych sieci enkoder–dekoder po zaawansowane podejścia generatywne i bazujące na przestrzeni stanu. Przy użyciu standardowych miar błędu, ostrości i podobieństwa strukturalnego ich model osiągnął niższe błędy na poziomie piksela i wyższe zgodności strukturalne niż wszystkie porównywane metody bazowe na zestawie testowym sztuki naskalnej. Badania ablacjne wykazują, że każdy dodany składnik — ekstrakcja priory w dwóch gałęziach oraz fuzja z bramkowaną uwagą — wnosi wyraźne korzyści. Porównania wizualne ukazują płynniejsze kontynuacje konturów postaci i symboli oraz bardziej naturalną integrację zrekonstruowanych obszarów z zwietrzałymi tłami. Mapy uwagi dodatkowo wskazują, że model koncentruje się na brakujących granicach, kluczowych obrysach symboli i strefach przejścia tekstury, zamiast bezmyślnie przemalowywać duże powierzchnie.
Co to oznacza dla ochrony przeszłości
Dla osób niebędących specjalistami główny wniosek jest taki, że metoda ta oferuje bardziej ostrożny i interpretowalny sposób cyfrowej naprawy starożytnych malowideł skalnych. Dzięki rozdzieleniu wskazówek dotyczących kształtu i powierzchni oraz regulowaniu ich wpływu w czasie, model może ponownie połączyć przerwane postacie i wypełnić brakujące fragmenty, zachowując jednocześnie wygląd i materialne wrażenie oryginalnego klifu. Autorzy podkreślają, że ich system jest narzędziem wspomagającym, a nie zastępującym ekspertyzę, oraz że potrzebne są bardziej zróżnicowane dane i ocena ekspertów. Mimo to praca wskazuje na przyszłość, w której zagrożone malowidła naskalne mogą być dokumentowane, badane i udostępniane w cyfrowo zrekonstruowanej formie, zachowując zarówno efekt wizualny, jak i znaczenie kulturowe bez interwencji fizycznej.
Cytowanie: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7
Słowa kluczowe: konserwacja sztuki naskalnej, dziedzictwo kulturowe, modele dyfuzyjne, uzupełnianie obrazów, malowidła z Huashan