Clear Sky Science · pl
Odtwarzanie zdjęć skorodowanej brązowni oparte na dyfuzji w ramach minimalnej interwencji: wskaźniki zgodności przestrzennej i diagnostyka ryzyka nadmiernej konserwacji
Dlaczego zdjęcia starych brązów nadal mają znaczenie
Fotografie starożytnych naczyń z brązu pokazują nie tylko piękne przedmioty; cicho dokumentują także, jak każde z nich starzało się pod ziemią i w magazynach muzealnych. Plamy korozji, łuszczące się powierzchnie i wielobarwna patyna to nie tylko skazy do „wyczyszczenia” na ekranie. Są to materialne wskazówki historyczne. W tym badaniu pytamy, jak współczesne narzędzia sztucznej inteligencji (AI) do naprawy obrazów można wykorzystać do uporządkowania uszkodzonych zdjęć brązowych przedmiotów bez przypadkowego wykasowania tych wskazówek i stworzenia mylącego obrazu przeszłości.

Naprawianie zdjęć bez wymazywania przeszłości
Muzea i archeolodzy polegają na archiwalnych zdjęciach brązowych przedmiotów w badaniach, katalogowaniu i udostępnianiu kolekcji. Wiele z tych obrazów jest uszkodzonych: fragmenty są brakujące, porysowane lub pokryte późniejszymi plamami. W codziennej edycji obrazu oprogramowanie swobodnie „upiększa” takie wady. Dla dziedzictwa kulturowego skorupy korozji i fragmentaryczna patyna są dowodem, a nie szumem. Autorzy traktują restaurację cyfrową jako problem „minimalnej interwencji”: zmienić tylko to, co konieczne, aby zdjęcie było czytelne, i pozostawić autentyczne ślady powierzchni. To sprawia, że restauracja to nie tylko kwestia atrakcyjności wizualnej, lecz uczciwości i wiarygodności.
Trzy narzędzia AI poddane testom
Badanie porównuje trzy wiodące podejścia AI, które potrafią uzupełniać brakujące części obrazów. LaMa reprezentuje szybkie, konwencjonalne sieci neuronowe, które wypełniają dziury na obrazach w jednym przejściu. Stable Diffusion Inpainting i ControlNet Inpainting to nowsze modele „dyfuzyjne”, które stopniowo ulepszają obrazy i są znane z generowania bogatych, realistycznych detali. Wszystkie trzy zostały poproszone o naprawę zdjęć wykopaliskowych naczyń z brązu z antycznego królestwa Gumei, używając dokładnie tych samych wejść i starannie przygotowanych masek uszkodzeń wskazujących, gdzie treść rzeczywiście brakuje.
Sprytny sposób mierzenia zmian pomocnych vs. szkodliwych
Ocena restauracji jest trudna, ponieważ rzadko istnieje doskonałe zdjęcie „po” uszkodzonym zabytku. Dlatego autorzy zaprojektowali dwa uzupełniające się testy. Po pierwsze, dla względnie nienaruszonych obrazów sztucznie zamazywali regiony i prosili każdą metodę o ich odbudowę. W tym przypadku mogli porównać wyniki z oryginałem i obliczyć standardowe wskaźniki jakości obrazu. Po drugie, dla autentycznie uszkodzonych zdjęć archiwalnych, gdzie nie ma prawdy bazowej, przenieśli uwagę z pytania „Jak dobrze to wygląda?” na „Gdzie algorytm faktycznie zmienił obraz?” Podzielili każde zdjęcie na trzy strefy: zamaskowane uszkodzenie, które powinno być zmienione, wąski pas tolerancyjny tuż poza tym obszarem, gdzie akceptowalna jest pewna przejściowa korekta, oraz nienaruszoną resztę powierzchni, gdzie zmiany są ryzykowne.

Wykrywanie i mapowanie ryzyka nadmiernej restauracji
Dla przypadków rzeczywistych uszkodzeń zespół zmierzył, jak często każda metoda wprowadzała silne zmiany wewnątrz maski, w pasie granicznym i dalej na pozornie nienaruszonych powierzchniach. Zwizualizowali te zmiany jako mapy cieplne, pokazując miejsca pojawienia się nowych pikseli lub przesunięć kolorów. Następnie zaprosili trzech ekspertów z zakresu konserwacji i archeologii, którzy w ocenie ślepej względem metody oceniali, które wyniki wydają się najbardziej autentyczne i czy poziom interwencji jest akceptowalny. Wszystkie trzy systemy AI potrafiły prawdopodobnie odtworzyć brakujące wzory i kształty, a modele dyfuzyjne często generowały bardziej imponujące tekstury wizualne. Jednakże częściej subtelnie wygładzały lub przemalowywały korozję i patynę poza obszarem uszkodzenia, zwiększając ryzyko atrakcyjnej, lecz mylącej „fałszywej rzeczywistości”.
Czego badanie uczy konserwatorów i technologów
Autorzy stwierdzili, że LaMa, mimo prostszej konstrukcji, naprawiał brakujące obszary z efektywnością porównywalną z modelami dyfuzyjnymi, jednocześnie powodując znacznie mniej niepożądanych zmian poza maską. Stable Diffusion i ControlNet dostarczały ostrzejsze, bardziej spójne wypełnienia, ale wykazywały wyższy odsetek „przecieków” na oryginalne powierzchnie, szczególnie w obszarach bogatych w korozję, które mają największe znaczenie jako dowód. Eksperci ocenili większość wyników ze wszystkich metod jako użyteczny materiał roboczy do dyskusji i nauczania, lecz nieodpowiedni jako ostateczne, samodzielne substytuty rzeczywistych artefaktów. Badanie konkluduje, że potężne narzędzia generatywne muszą być łączone ze ścisłymi, przejrzystymi kontrolami miejsc ich interwencji. Przekształcając konserwatorski ideał „minimalnej interwencji” w mierzalne wskaźniki przestrzenne i wizualne mapy ryzyka, autorzy oferują muzeom i badaczom praktyczny sposób wykorzystania AI w restauracji przy jednoczesnym zabezpieczeniu autentyczności.
Cytowanie: Sui, Q., Shou, W. & Yang, H. Diffusion-based restoration of corroded bronzeware images under a minimal-intervention framework: spatial-compliance indices and over-restoration risk diagnostics. npj Herit. Sci. 14, 259 (2026). https://doi.org/10.1038/s40494-026-02539-y
Słowa kluczowe: restauracja cyfrowa, fotografia dziedzictwa kulturowego, artefakty z brązu, inpainting obrazu, minimalna interwencja