Clear Sky Science · pl
Identyfikacja pisarza dla poetyckiej ceramiki z pieca Changsha z dynastii Tang za pomocą modelu uwagi globalnej wieloskalowej z podwójną ścieżką
Wiersze na glinie, opowieści o ludziach
Na powierzchni małych garnuszków i poduszek porcelanowych z okresu dynastii Tang, ponad tysiąc lat temu, po mokrym szkliwie kreślono finezyjne linie poezji. Krótkie te wersy są dziś cenione nie tylko za swoją urodę, lecz także za to, co mogą ujawnić o osobach, które je zapisały. Do tej pory powiązanie konkretnego napisu z konkretnym rękopisem opierało się na wprawnym oku garstki ekspertów. Niniejsze badanie pokazuje, jak współczesna sztuczna inteligencja może pomóc „odczytać” ludzką rękę stojącą za tymi delikatnymi artefaktami, otwierając nowe okno na życie codzienne, pracę i handel we wczesnym średniowiecznym Chinach.

Dlaczego te naczynia mają znaczenie
Piec Changsha, działający w okresie rozkwitu dynastii Tang, produkował barwną ceramikę zdobioną malarstwem, kaligrafią i poezją. Przedmioty te podróżowały szeroko wzdłuż wczesnych szlaków handlowych i stały się nośnikami literatury i gustu, a także użytecznymi naczyniami. Ich inskrypcje zachowują nie tylko tekst, lecz także energię pociągnięć pędzla i wybory poszczególnych pisarzy. Jednak większość zachowanych egzemplarzy jest rozrzucona po muzeach i kolekcjach prywatnych, a wysokiej jakości zdjęć jest niewiele. Nie istniał żaden publiczny, ustandaryzowany zbiór obrazów tych inskrypcji, co utrudniało badaczom porównywanie obiektów, testowanie metod cyfrowych czy zadawanie podstawowych pytań, na przykład: Czy jeden garncarz-pisarz napisał wiersze na kilku różnych naczyniach?
Budowanie cyfrowej biblioteki pisma Tang
Aby sprostać temu wyzwaniu, autorzy najpierw zgromadzili nową kolekcję zdjęć z opublikowanych katalogów ceramiki z Changsha. Z 135 indywidualnych artefaktów — głównie dzbanów, talerzy i poduszek z wierszami lub krótkimi notatkami — starannie wydobyli 1 865 obrazów pojedynczych znaków. Ponieważ inskrypcje znajdują się na zakrzywionych powierzchniach naczyń, znaki blisko boków wydają się na zdjęciach zdeformowane. Zespół zastosował specjalistyczny proces segmentacji obrazu i spłaszczania powierzchni, aby skorygować tę krzywiznę, następnie usunął zabrudzenia i pęknięcia, przekształcił obrazy do skali szarości, zmienił ich rozmiar, zredukował szum i nieco odwrócił część obrazów, aby zwiększyć różnorodność. Efektem jest pierwszy dedykowany zbiór danych poetyckiego pisma z pieca Changsha, zasób, który może wspierać rozpoznawanie pisma, analizę stylu i wiele innych badań w przyszłości.
Nauczanie sieci neuronowej rozpoznawania stylu
Dysponując tym zbiorem, badacze zaprojektowali system widzenia komputerowego, którego zadaniem jest zdecydować, czy dwa obrazy znaków prawdopodobnie napisała ta sama osoba. Model przyjmuje parę znaków przez dwa równoległe kanały, które dzielą te same etapy przetwarzania. Po wstępnym filtrowaniu oba obrazy przechodzą przez głęboką sieć neuronową (ResNet-34), która wyodrębnia wzory w grubości pociągnięć, krzywiznach, odstępach i innych subtelnych cechach. W sercu systemu znajduje się nowy moduł uwagi globalnej wieloskalowej. Zamiast przyglądać się tylko jednemu ustalonemu poziomowi szczegółu, moduł ten bada znaki jednocześnie na kilku skalach — od ogólnego układu po drobne zawirowania pociągnięć — i uczy się, jak odległe części pociągnięcia odnoszą się do siebie. Łącząc te widoki, model buduje bogaty wewnętrzny „odcisk palca” stylu każdego pisarza, a następnie porównuje te odciski, aby wygenerować wynik podobieństwa od 0 do 1.

Testowanie systemu
Zespół porównał kilka popularnych architektur sieciowych i mechanizmów uwagi i stwierdził, że ich sieć z dwiema ścieżkami z nowym modułem uwagi osiąga najlepsze wyniki. Uzyskała ona dokładność rozpoznawania na poziomie około 97,9%, wyraźnie przewyższając starsze modele uwagi jednoskalowej. Aby zobaczyć, czego algorytm się nauczył, autorzy wygenerowali mapy cieplne pokazujące, gdzie sieć „patrzy” najdokładniej. Podkreślają one załamania pociągnięć, pochyłe lewe kreski i inne obszary, gdzie nacisk pędzla i rytm różnią się między osobami — podobnie jak to, co badałby ludzki znawca. Badacze przeprowadzili następnie duże testy partiami w obrębie pojedynczych artefaktów i między różnymi artefaktami. W obrębie jednego naczynia system konsekwentnie oceniał wszystkie znaki jako wysoce podobne, co wspiera hipotezę, że wiersz na każdej naczyniu został napisany przez jednego pisarza, a nie kilku.
Nowe wskazówki o dawnych rzemieślnikach
Najbardziej uderzający wynik pojawił się, gdy model porównał egzemplarze z różnych kolekcji. Dwie ceramiczne poduszki z inskrypcjami miłosnych wierszy siedmioznakowych wykazały bardzo wysokie podobieństwo stylistyczne, mimo że obecnie znajdują się w oddzielnych instytucjach. Zapisy archeologiczne lokują obie poduszki na tym samym stanowisku pieca, a ich kształty, motywy dekoracyjne i tematy zgadzają się ze sobą. Werdykt algorytmu — 85,8% prawdopodobieństwa, że tę samą ręką napisano obie inskrypcje — potwierdza wniosek, że wyszły spod ręki jednego pisarza. Dla kontrastu trzy podobne dzbanki na wino z pokrewnymi wierszami ostrzegawczymi o żalu wykazały niskie wyniki podobieństwa, co sugeruje trzech różnych kaligrafów kopiujących wspólny tekstowy wzorzec. Razem te odkrycia pokazują, jak „oko” AI może pomóc historykom śledzić organizację warsztatów, podział pracy i praktyki handlowe.
Co to znaczy dla przeszłości i przyszłości
Łącząc staranną cyfrową dokumentację obrazową z zaawansowaną siecią neuronową, to badanie przekształca delikatne ślady atramentu na ceramice w dowody ilościowe dotyczące tego, kto co napisał. Dla przeciętnego czytelnika główna myśl jest taka, że widzenie komputerowe potrafi dziś rozróżniać indywidualne ręce w starożytnej kaligrafii niemal tak niezawodnie jak ekspert ludzki, ale znacznie szybciej i w odniesieniu do o wiele większej liczby obiektów. Umożliwia to łączenie rozproszonych egzemplarzy, mapowanie kariery zapomnianych rzemieślników i lepsze zrozumienie, jak masowa produkcja i osobista ekspresja współistniały w dynastii Tang. Choć metoda nie jest doskonała i zależy od ograniczonych, czasem uszkodzonych danych, oferuje potężne nowe narzędzie dla muzeów i badaczy — oraz model zastosowania AI do wielu innych rodzajów historycznego pisma ręcznego.
Cytowanie: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5
Słowa kluczowe: starożytne pismo ręczne, ceramika z dynastii Tang, identyfikacja pisarza, uczenie głębokie, dziedzictwo cyfrowe