Clear Sky Science · pl

Metoda rekonstrukcji znaków JianDu oparta na międzydomenowym odbiasowanym łączeniu Fouriera i parametryzowanym zapytaniu współrzędnych

· Powrót do spisu

Przywracanie wyblakłych tekstów z bambusa do życia

Przez ponad dwa tysiące lat chińscy urzędnicy, żołnierze i uczeni zapisywali informacje na cienkich paskach bambusa i drewna. Dziś te kruche „jiandu” zawierają bezcenne wskazówki dotyczące polityki, handlu i codziennego życia w starożytnych Chinach — ale pismo często jest zniszczone przez wiek, pleśń i uszkodzenia. W artykule przedstawiono nową technikę sztucznej inteligencji (AI), która potrafi cyfrowo odtwarzać pojedyncze znaki na tych paskach, pomagając historykom odczytać teksty, które w innym wypadku byłyby niemal nieczytelne.

Figure 1
Figure 1.

Dlaczego stare bambusowe teksty są tak trudne do odczytania

W odróżnieniu od współczesnych drukowanych stron, paski bambusowe i drewniane mają wyraźnie wzorzyste powierzchnie poprzecinane włóknami i plamami. Interesujące nas pociągnięcia tuszu są cienkie i słabe, podczas gdy tło ma silne i nieregularne faktury. Dla komputera tło może być głośniejsze niż samo pismo. Plamy pleśni gładko przyciemniają fragmenty powierzchni, a spękania lub brakujące fragmenty całkowicie zamazują części znaków. Standardowe programy do naprawy obrazów, które dobrze działają na zwykłych fotografiach, mają tendencję do rozmywania tych delikatnych pociągnięć, wymyślania fałszywych struktur lub rozpraszania szumu tła w obszary, gdzie powinny być znaki.

Skoncentrowane podejście do odbudowy brakujących pociągnięć

Wiele metod rekonstrukcji próbuje odtworzyć każdy piksel obrazu, nawet w obszarach całkowicie nienaruszonych. Autorzy zamiast tego zaprojektowali system, który koncentruje wysiłki na uszkodzonych strefach i ich bezpośrednim otoczeniu. Najpierw sieć „generująca parametry” skanuje zeskalowaną wersję uszkodzonego paska wraz z maską pokazującą, gdzie brakuje informacji. Następnie tworzy zwarty zestaw instrukcji — w zasadzie przepis — dopasowany do dziur i pobliskiego kontekstu. Druga sieć „zapytania pikselowego” używa tego przepisu wraz z dokładnymi współrzędnymi każdego piksela w obrębie uszkodzonych obszarów, aby rekonstruować je pojedynczo. Ponieważ sieć zawsze wie dokładnie, nad którym fragmentem obrazu pracuje, może lepiej zachować drobne detale, takie jak krawędzie i połączenia pociągnięć, nawet przy wysokiej rozdzielczości.

Łączenie przestrzeni i fal bez zniekształceń

Aby zrozumieć i naprawić złożone wzory, metoda nie opiera się wyłącznie na kształtach w płaszczyźnie obrazu. Analizuje także, jak jasne i ciemne wariacje rozkładają się na różnych skalach, używając transformaty Fouriera — narzędzia matematycznego, które przedstawia obraz jako mieszaninę fal. W obrazach jiandu niskoczęstotliwościowe składowe opisują głównie tło bambusowe, podczas gdy wysokie częstotliwości chwytają ostre krawędzie znaków. Jednak naiwne stosowanie powszechnych trików sieci neuronowych w tej domenie fal może zaburzyć spektrum, prowadząc do dziwnych bloków kolorystycznych i przenikania wzorów tła w pociągnięcia. Autorzy wprowadzają więc „odbiasowany” moduł Fouriera, który przearanżowuje i przecentrowuje widmo, oznacza każdą taśmę częstotliwości uczącą się pozycją i łagodnie normalizuje wartości skrajne. Równocześnie blok fuzji przestrzenno‑częstotliwościowej pozwala cechom przestrzennym (lokalnym kształtom i teksturom) oraz cechom częstotliwościowym (globalnym wzorom i statystykom szumu) kierować się nawzajem za pomocą mechanizmu cross‑attention, tworząc bogatszy i bardziej stabilny opis uszkodzonego obrazu.

Figure 2
Figure 2.

Testy metody

Zespół zgromadził dużą bazę danych ponad 60 000 obrazów pojedynczych znaków z pasków bambusowych i drewnianych obejmujących kilka dynastii chińskich, starannie przefiltrowaną pod względem jakości i podzieloną na zestawy treningowe i testowe. Użyli także ustalonych kolekcji sztucznych masek uszkodzeń, aby naśladować różne rodzaje utraty — małe ubytki, duże brakujące obszary oraz losowe kształty przypominające pęknięcia — oraz zestawu zdjęć ulicznych, by sprawdzić, jak metoda generalizuje poza materiałami dziedzictwa. W szeregu testów nowe podejście dokładniej rekonstruowało brakujące obszary niż siedem wiodących technik inpaintingu, uzyskując wyższe wyniki w miarach dokładności pikselowej, postrzeganej ostrości i podobieństwa strukturalnego. Porównania wizualne pokazują czystsze pociągnięcia znaków, mniej mozaikowych artefaktów i mniejsze zanieczyszczenie teksturą tła, nawet gdy plamy pleśni lub wzory włókien są intensywne.

Co to oznacza dla odczytywania przeszłości

Ostatecznie praca ta oferuje wyspecjalizowanego cyfrowego „konserwatora” dla starożytnych tekstów bambusowych i drewnianych. Ucząc się oddzielać kruche pociągnięcia tuszu od zaszumionych, zbutwiałych teł — oraz ostrożnie zarządzając interakcjami między kształtami przestrzennymi a falopodobnymi wzorami — metoda potrafi wypełniać brakujące części znaków w sposób wiarygodny dla ekspertów i użyteczny dla automatycznego rozpoznawania znaków. Choć wciąż ma trudności z bardzo dużymi ubytkami i niektórymi złożonymi stylami pisma, podejście stanowi znaczący krok w kierunku przekształcenia słabych, połamanych śladów na starożytnych paskach w czytelny, możliwy do analizy tekst dla historyków, językoznawców i szerszej publiczności.

Cytowanie: Lu, Z., Wang, T., Hu, X. et al. A JianDu character restoration method based on cross-domain debiased fourier fusion and parameterized coordinate query. npj Herit. Sci. 14, 159 (2026). https://doi.org/10.1038/s40494-026-02414-w

Słowa kluczowe: restauracja taśm bambusowych, starożytne chińskie znaki, uzupełnianie obrazów, uczenie głębokie oparte na Fouriera, cyfrowe dziedzictwo kulturowe