Clear Sky Science · sv
Identifiering av skrivare för Changsha-ugnens poetiska keramik från Tangdynastin via en tvåvägs multi-skala global uppmärksamhetsmodell
Dikter på lera, människors berättelser
På ytan av små porslinskärl och kuddar från Tangdynastin målades för mer än tusen år sedan eleganta rader av poesi över våt glasyr. Dessa korta verser vårdas i dag inte bara för sin skönhet, utan också för vad de kan avslöja om dem som skrev dem. Hittills har kopplingen mellan en viss inskrift och en viss skrivare byggt på några få experters ögon. Denna studie visar hur modern artificiell intelligens kan hjälpa till att läsa den mänskliga hand som ligger bakom dessa sköra föremål och öppnar ett nytt fönster mot vardagsliv, arbete och handel i tidig medeltida Kina.

Varför dessa kärl är betydelsefulla
Changsha-ugnen, verksam under den blomstrande Tangdynastin, producerade färgrik keramik dekorerad med målning, kalligrafi och poesi. Dessa objekt färdades vida längs tidiga handelsvägar och blev bärare av litteratur och smak, liksom praktiska bruksföremål. Deras inskrifter bevarar inte bara texten utan också penselns energi och de enskilda skribenternas val. De flesta överlevande föremålen är dock spridda mellan museer och privata samlingar, och högkvalitativa bilder är få. Inga offentliga, standardiserade bilddatamängder av dessa inskrifter fanns tidigare, vilket försvårade för forskare att jämföra föremål, testa digitala metoder eller ställa grundläggande frågor som: Hade en och samma krukmakare-skrivare skrivit dikterna på flera olika kärl?
Att bygga ett digitalt bibliotek över Tang-handskrift
För att tackla detta samlade författarna först en ny bildsamling från publicerade kataloger över Changsha-keramik. Från 135 individuella föremål—mest krukor, fat och kuddar med poesi eller korta anteckningar—extraherade de noggrant 1 865 enskaraktärsbilder. Eftersom inskrifter ligger på krökta keramiska ytor framstår tecken nära kanterna som förvrängda på fotografier. Teamet använde en specialiserad bildsegmenterings- och ytplattningsprocess för att korrigera denna krökning, rengjorde sedan bort smuts och sprickor, konverterade bilder till gråskala, ändrade storlek, reducerade brus och spegelvände vissa bilder lätt för att öka variationen. Resultatet är den första dedikerade datamängden av Changsha-ugnens poetiska handskrift, en resurs som kan stödja teckenigenkänning, stilanalys och många andra studier framöver.
Att lära ett neuralt nätverk att se stil
Med denna datamängd utformade forskarna ett datorseendesystem vars uppgift är att avgöra om två teckenbilder sannolikt skrevs av samma person. Modellen tar emot ett par tecken genom två parallella kanaler som delar samma bearbetningssteg. Efter grundläggande filtrering passerar båda bilderna ett djupt neuralt nätverk (ResNet-34) som extraherar mönster i penseldjup, kurvor, mellanrum och andra subtila drag. I systemets kärna finns en ny multi-skala global uppmärksamhetsmodul. I stället för att bara betrakta en fast detaljnivå undersöker denna modul tecknen på flera skalor samtidigt—från grov layout ner till finare penseldrag—och lär sig hur avlägsna delar av ett streck relaterar till varandra. Genom att kombinera dessa vyer bygger modellen ett rikt internt ”fingeravtryck” av varje skrivares stil och jämför sedan de två fingeravtrycken för att ge en likhetspoäng mellan 0 och 1.

Systemets prövning
Teamet jämförde flera populära neurala nätverksbackbones och uppmärksamhetsmekanismer och fann att deras tvåvägsnätverk med den nya uppmärksamhetsmodulen presterade bäst. Det nådde en igenkänningsnoggrannhet på omkring 97,9 %, tydligt överlägset äldre, enkelskala uppmärksamhetsmodeller. För att se vad algoritmen lärt sig genererade författarna värmekartor som visar var nätverket ”tittar” mest noggrant. Dessa framhäver penselvändningar, sluttande vänsterstreck och andra områden där penseltryck och rytm skiljer sig mellan personer—mycket som en mänsklig kännare skulle undersöka. Forskarna körde sedan stora batchtester inom enskilda föremål och mellan olika föremål. Inom ett enda kärl bedömde systemet konsekvent att alla tecken var mycket lika, vilket stöder idén att varje kärls dikt skrevs av en enda skrivare snarare än flera.
Nya ledtrådar om forntida hantverkare
Det mest slående resultatet kom när modellen jämförde föremål från olika samlingar. Två keramikkuddar med kärlekstema i sjuteckniga dikter visade mycket hög stilistisk likhet, trots att de nu finns i separata institutioner. Arkeologiska uppteckningar placerar båda kuddarna vid samma ugnsplats, och deras former, dekorativa motiv och teman stämmer väl överens. Algoritmens dom—en 85,8 % sannolikhet att samma hand skrev båda inskrifterna—stödjer slutsatsen att de skapats av en enskild skrivare. I kontrast visade tre liknande vinkannor med relaterade varningsverser om ånger låga likhetspoäng, vilket tyder på tre olika kalligrafer som kopierat en gemensam textformel. Tillsammans visar dessa fynd hur ett AI-"öga" kan hjälpa historiker att spåra verkstadsorganisation, arbetsdelning och handelsmönster.
Vad detta betyder för dåtid och framtid
Genom att kombinera omsorgsfull digital avbildning med ett sofistikerat neuralt nätverk förvandlar denna studie sköra bläckspår på keramik till kvantitativ bevisning om vem som skrev vad. För den allmänne läsaren är huvudpoängen att datorseende nu kan skilja individuella händer i forntida kalligrafi nästan lika pålitligt som en mänsklig expert, men mycket snabbare och över betydligt fler objekt. Det gör det möjligt att koppla samman föremål spridda över världen, kartlägga karriärer hos länge bortglömda hantverkare och bättre förstå hur massproduktion och personlig uttrycksform samexisterade under Tangdynastin. Även om metoden inte är perfekt och beror på begränsade, ibland skadade data, erbjuder den ett kraftfullt nytt verktyg för museer och forskare—och en modell för hur AI kan tillämpas på många andra typer av historisk handskrift.
Citering: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5
Nyckelord: forntida handskrift, keramik från Tangdynastin, identifiering av skrivare, djupinlärning, digitalt kulturarv