Clear Sky Science · pl

Weryfikacja pisma na bambusowych paskach Tsinghua przy użyciu sieci syjamskich

2026-03-11 · Powrót do spisu

Starożytne księgi spotykają nowoczesny kod

Na długo przed wynalezieniem papieru i ekranów chińscy myśliciele pisali na wąskich paskach bambusa. Dziś te kruche rękopisy są skarbnicą wiedzy dla historyków, ale podstawowe pytanie okazuje się zaskakująco trudne: które paski napisała ta sama ręka? Badanie łączy archeologię z sztuczną inteligencją, tworząc cyfrowego asystenta, który może pomóc badaczom ustalić, kto napisał które fragmenty wśród tysięcy 2,300‑letnich pasków bambusowych z słynnej kolekcji Uniwersytetu Tsinghua.

Dlaczego pismo ręczne ma znaczenie

Paski bambusowe z Tsinghua pochodzą z okresu Walczących Królestw, tuż przed powstaniem pierwszego cesarstwa Chin. Zawierają wczesne wersje tekstów o polityce, historii i filozofii, które wpłynęły na późniejszą tradycję lub z niej zaginęły. Aby w pełni zrozumieć te pisma, badacze muszą wiedzieć, jak paski były grupowane, które fragmenty należą do tych samych manuskryptów i ilu kopistów w nich pisało. Tradycyjnie eksperci odpowiadają na te pytania wzrokowo, oceniając gładkość pociągnięć, nacisk i układ. Ta umiejętność jest czasochłonna, subiektywna i trudna do skalowania w miarę pojawiania się nowych znalezisk.

Przekształcanie pociągnięć w dane

Autorzy postawili sobie za cel nauczyć komputer porównywania pojedynczych znaków wyciętych z fotografii o wysokiej rozdzielczości pasków. Najpierw zbudowali dużą kolekcję obrazów: 15 745 pojedynczych znaków od 11 wcześniej zidentyfikowanych kopistów, opartą na konsensusie badań paleograficznych. Przy użyciu profesjonalnego oprogramowania do przetwarzania obrazu usunęli szumy tła, wyizolowali każdy znak w prostokącie i odfiltrowali uszkodzone lub nałożone na siebie znaki. Następnie powiększyli mniejsze klasy — kopistów z niewielką liczbą zachowanych znaków — prostymi zabiegami, takimi jak odbicia lustrzane, obracanie, przycinanie i dodawanie szumu, aby algorytm nie był uprzywilejowany względem częstszych stylów.

Sieć bliźniacza szukająca podobieństw

Zamiast prosić komputer o wskazanie autora każdego znaku, zespół postawił prostsze, a zarazem bardziej elastyczne pytanie: czy te dwa obrazy pochodzą od tej samej ręki? W tym celu użyli sieci neuronowej „syjamskiej”, pary identycznych gałęzi przetwarzających obraz, które dzielą parametry. Każda gałąź zamienia obraz znaku na kompaktowy numeryczny odcisk palca. System mierzy następnie odległość między dwoma odciskami: małe odległości sugerują tego samego kopistę, większe — różnych. W sercu każdej gałęzi znajduje się ulepszony lekki model nazwany MobileNet_V3+, wzbogacony mechanizmem uwagi, który uczy się podkreślać najbardziej wymowne cechy wizualne — subtelne zakrzywienia, grubość pociągnięć czy preferowane sposoby formowania fragmentów znaków — przy jednoczesnym umniejszaniu roli mniej istotnych detali.

Jak dobrze działa system

Na zbiorze Tsinghua najlepsza wersja modelu poprawnie oceniała, czy pary znaków pochodziły od tego samego kopisty, w około 90% przypadków, osiągając bardzo wysoki wynik w standardowym teście dyskryminacji dwuklasowej. Przewyższał kilka cięższych systemów rozpoznawania obrazów, takich jak ResNet, VGG czy Vision Transformers, które miały skłonność do przeuczania się na ograniczonych danych lub pomijania subtelnych wskazówek stylistycznych niezbędnych w tym zadaniu. Wizualne inspekcje „map uwagi” sieci pokazały, że w miarę treningu model przestał patrzeć na ogólny zarys i zamiast tego skupił się na kluczowych segmentach pociągnięć — podobnie jak ekspert ludzki.

Pomoc w rozstrzyganiu rzeczywistych sporów naukowych

Aby sprawdzić przydatność narzędzia poza laboratorium, autorzy zastosowali je do kilku manuskryptów bambusowych, których autorstwo było od lat przedmiotem dyskusji. Dla trzech tekstów („Ji Gong”, „Hou Fu” i „She Ming”) wcześniejsi badacze stopniowo uznali, że zostały napisane przez tego samego kopistę z szerszej grupy „Yin Zhi”. Model silnie potwierdził to stanowisko, znajdując bardzo wysokie podobieństwo we wszystkich parach. Dla innej pary manuskryptów, „Zhi Zheng” i „Zhi Bang”, badacze spierali się, czy uczestniczył jeden, czy kilku kopistów. Porównania sieci zasugerowały, że strony 1–42 „Zhi Zheng” tworzą jeden wyraźny styl pisma, podczas gdy strona 43 „Zhi Zheng” silnie pasowała do „Zhi Bang”, ale nie do wcześniejszych stron — dowód na istnienie dwóch odrębnych kopistów, niezaliczanych do wcześniej zdefiniowanych kategorii.

Co to oznacza dla przeszłości i przyszłości

Mówiąc prosto, praca ta pokazuje, że kompaktowy system AI może wiarygodnie stwierdzić, czy dwa maleńkie fragmenty starożytnego pisma prawdopodobnie pochodzą od tej samej osoby, nawet gdy ma do dyspozycji tylko pojedyncze znaki. Nie zastąpi to osądu ekspertów, ale może szybko przeskanować duże zbiory, wskazać prawdopodobne dopasowania i dostarczyć ilościowych dowodów za lub przeciw określonym grupowaniom pasków. Poza zbiorem Tsinghua to samo podejście można dostosować do innych kruchych zapisów, od kości wyroczni po zwoje Jedwabnego Szlaku, pomagając historykom i językoznawcom odtwarzać, jak idee przemierzały czas i przestrzeń.

Cytowanie: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8

Słowa kluczowe: bambusowe paski, analiza pisma ręcznego, uczenie głębokie, dziedzictwo kulturowe, sieć syjamska