Clear Sky Science · pl

Odtwarzanie znaków na zwojach z Liye z użyciem sieci generatywno‑rywalizacyjnej z efektywnym ograniczeniem składowych spójnych

2026-03-30 · Powrót do spisu

Starożytne słowa przywrócone do życia

Na długo przed wynalezieniem papieru chińscy urzędnicy zapiski składali na wąskich listkach bambusa i drewna. Tysiące tych kruchej dokumentów, znanych jako zwoje Qin z Liye, wydobyto z opuszczonego studni po ponad dwóch tysiącach lat pod ziemią. Zawierają codzienne rozkazy, księgi rachunkowe i raporty z pierwszego zjednoczonego imperium chińskiego. Woda, muł i mikroby jednak rozmyły lub zniszczyły dużą część tuszu, przez co odczytywanie zwojów ręcznie przebiega bardzo powoli. Badanie pokazuje, jak współczesny system sztucznej inteligencji potrafi cyfrowo „odczyścić” te uszkodzone znaki, pomagając historykom odzyskać głosy z odległej przeszłości.

Dlaczego te zakopane zapisy są ważne

Zwoje Qin z Liye to nie królewskie dekrety ani monumentalne inskrypcje; są dokumentacją pracy administracji. Ponad 30 000 zwojów rejestruje podatki, pracę i rutynową administrację w jednej powiecie na skraju imperium Qin. W przeciwieństwie do podobnych znalezisk z suchych grobowców, fragmenty z Liye zalegały w wilgotnym osadzie na dnie studni. Wiele z nich jest odkształconych, pękniętych i poplamionych; pociągnięcia pędzla są rozmazywane lub ubytki. Odczytanie pojedynczego zestawu może zająć ekspertom lata, a rosnąca liczba odkryć przewyższa możliwości samych ludzkich oczu. Zautomatyzowanie części procesu restauracji mogłoby znacznie przyspieszyć badania, zachowując jednocześnie subtelne kształty, które czynią każdy znak czytelnym.

Nauka komputera widzenia pomimo uszkodzeń

Autorzy traktują restaurację jako rodzaj translacji obrazu: komputer otrzymuje mały, zaszumiony obraz znaku i ma wygenerować, jak ten znak wyglądałby, gdyby był czysty i ostry. W tym celu bazują na typie AI zwanym siecią generatywno‑rywalizacyjną, czyli GAN. Jedna sieć („generator”) próbuje przekształcić uszkodzony obraz w wyraźny, podczas gdy druga („dyskryminator”) ocenia, czy wynik wygląda jak autentyczny, dobrze napisany znak. Dzięki tej wzajemnej rywalizacji generator stopniowo uczy się tworzyć coraz bardziej przekonujące rekonstrukcje, które potrafią zmylić krytyka.

Bardziej wyraziste skupienie na drobnych pociągnięciach pędzla

Standardowe narzędzia obrazowe często pomijają najdrobniejsze detale tuszu na bambusie, zwłaszcza gdy tło jest plamiste, a tusz słaby. Zespół ulepsza sedno GAN, stosując kształt U znany jako U‑Net, który równoważy szeroki kontekst z detalami na poziomie pikseli. Zwykłe bloki budulcowe tej sieci zastąpiono specjalnie zaprojektowanymi Lokalnymi Resztkowymi Gęstymi Blokami (Local Residual Dense Blocks). Bloki te zachęcają system do ponownego wykorzystania użytecznych wzorców, unikając nadmiernego wygładzania, które może powodować rozmycie sąsiednich pociągnięć. Wzmocniona sekcja „butelki” w środku sieci dodatkowo dopracowuje najważniejsze cechy, pomagając modelowi odróżniać prawdziwe pociągnięcia od szumu nawet wtedy, gdy oryginał jest mocno zniszczony.

Zachowanie szkieletu każdego znaku

Kluczową innowacją jest to, co autorzy nazywają ograniczeniem Efektywnej Domeny Spójnej (Effective Connected Domain). Zamiast oceniać każdy piksel z osobna, zasada ta analizuje główne obszary tuszu w znaku: jak duże są i gdzie leżą ich środki. Model porównuje te z grubsza zarysowane „wyspy” tuszu w swoim wyjściu z tymi w starannie odtworzonych obrazach referencyjnych, zwracając szczególną uwagę tylko na kilka największych, które tworzą podstawowy szkielet znaku. Jeśli istotne pociągnięcie zaginie, złączy się z innym lub przesunie się, system zostaje ukarany i zmuszony do poprawy. To proste geometryczne sprawdzenie okazuje się wyjątkowo stabilne nawet wtedy, gdy pociągnięcia są przerwane, krawędzie postrzępione, lub tusz rozlał się na tło.

Jak skuteczne są cyfrowe naprawy

Ponieważ nie istniały odpowiednie dane, zespół stworzył własny sparowany zbiór danych składający się z 600 obrazów znaków ze zwojów Liye, z których każdy dopasowano do starannej, wykonanej przez ekspertów rekonstrukcji. Na tym zestawie testowym ich metoda przewyższa kilka najnowocześniejszych podejść, w tym inne GAN‑y, model oparty na Transformerze oraz model dyfuzyjny, według trzech standardowych miar jakości obrazu. Porównania wizualne obok siebie wykazują mniej przerwanych pociągnięć, czystsze rozdzielenie bliskich linii pędzla i mniejsze zanieczyszczenie tła. Instruktorzy kaligrafii, którzy oceniali wyniki w teście podwójnie ślepym, wysoko ocenili ciągłość pociągnięć, dokładność strukturalną i ogólną czytelność, a odrębne testy sugerują, że model nie po prostu zapamiętuje dane treningowe.

Przywracanie zakopanych pism do ostrości

Dla niespecjalistów przekaz jest jasny: łącząc wiedzę ekspertów o starożytnych pismach z dopasowanymi projektami AI, można obecnie odzyskać czytelne zapisy z zwojów bambusowych, które wcześniej wydawały się zbyt uszkodzone, by ich użyć. Model zachowuje nie tylko fakt obecności znaku, lecz także przestrzenne relacje jego pociągnięć, co czyni wynik wartościowym dla historyków i językoznawców. Chociaż podejście nadal zależy od ograniczonych danych treningowych i musi zostać przystosowane do innych materiałów, takich jak jedwab czy kamień, wskazuje drogę ku przyszłości, w której wiele kruchych, trudno czytelnych tekstów będzie można cyfrowo odrestaurować i badać na większą skalę, otwierając nowe okna na codzienne życie we wczesnych imperiach.

Cytowanie: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6

Słowa kluczowe: restauracja zwojów bambusowych, starożytne chińskie rękopisy, sieci generatywno‑rywalizacyjne, cyfrowa ochrona dziedzictwa, odzyskiwanie znaków pisanych odręcznie