Clear Sky Science · sv

Verifiering av skrivare på Tsinghuas bambustrippar med Siamese-nätverk

· Tillbaka till index

Forntida böcker möter modern kod

Långt före papper och skärmar skrev kinesiska tänkare på smala bambustrippar. I dag är dessa sköra manuskript skattkistor för historiker, men en grundläggande fråga är förvånansvärt svår att besvara: vilka strippar skrev samma hand? Denna studie förenar arkeologi och artificiell intelligens för att bygga en digital assistent som kan hjälpa forskare att avgöra vem som skrev vad på tusentals 2 300 år gamla bambustrippar i Tsinghua-universitetets berömda samling.

Figure 1
Figure 1.

Varför handstilen spelar roll

Tsinghuas bambustrippar dateras till krigarforskningens tid, strax före Kinas första imperium. De bevarar tidiga versioner av texter om politik, historia och filosofi som antingen formade eller senare förlorade sig i traditionen. För att verkligen förstå dessa skrifter behöver forskare veta hur stripparna grupperades, vilka delar som tillhör samma manuskript och hur många skribenter som arbetade med dem. Traditionellt besvaras sådana frågor med ögat, där experter väger strokornas jämnhet, tryck och layout. Detta hantverk är långsamt, subjektivt och svårt att skala upp när nya fynd dyker upp.

Att omvandla streck till data

Författarna gav sig i kast med att lära en dator att jämföra individuella handskrivna tecken utskurna från högupplösta foton av stripparna. De byggde först upp en stor bildsamling: 15 745 enskilda tecken från 11 tidigare identifierade skribenter, baserat på konsensus inom paleografiska studier. Med professionell bildbehandlingsprogramvara tog de bort bakgrundsbrus, isolerade varje tecken i en rektangel och filtrerade bort skadade eller överlappande tecken. De utökade sedan de mindre klasserna — skribenter med bara några få bevarade tecken — genom enkla trick som spegling, rotation, beskärning och tillsats av brus, så att algoritmen inte skulle bli partisk mot vanligare stilar.

Ett tvillingnätverk som söker likhet

I stället för att be datorn namnge skribenten för varje tecken ställde teamet en enklare men mer flexibel fråga: kommer dessa två bilder från samma hand? För detta använde de ett ”Siamese”-neuronätverk, ett par identiska bildbehandlande grenar som delar parametrar. Varje gren omvandlar en teckenbild till ett kompakt numeriskt fingeravtryck. Systemet mäter sedan avståndet mellan de två fingeravtrycken: små avstånd antyder samma skribent, större avstånd tyder på olika skribenter. I kärnan av varje gren finns en uppgraderad lättviktig modell kallad MobileNet_V3+, förbättrad med en uppmärksamhetsmekanism som lär sig att betona de mest talande visuella dragen — subtila kurvor, strokans tjocklek eller föredragna sätt att forma delar av tecken — samtidigt som mindre användbara detaljer tonas ner.

Figure 2
Figure 2.

Hur bra systemet fungerar

På Tsinghua-datasetet bedömde den bästa versionen av modellen korrekt huruvida par av tecken kom från samma skribent i ungefär 90 % av fallen, med en mycket hög poäng på ett standardtest för tvåkategori-diskriminering. Den överträffade flera tyngre bildigenkänningssystem, såsom ResNet, VGG och Vision Transformers, som tenderade att antingen överanpassa den begränsade datamängden eller missa de fina stilistiska ledtrådarna som krävs för denna uppgift. Visuella inspektioner av nätverkets ”uppmärksamhetskartor” visade att modellen, i takt med träningen, slutade fokusera på den övergripande silhuetten och i stället låste sig på nyckelsegment i strecken — ungefär som en mänsklig expert.

Hjälper till att lösa verkliga vetenskapliga debatter

För att se om verktyget är användbart utanför laboratoriet applicerade författarna det på flera bambumanuskript vars författarskap debatterats i åratal. För tre texter (”Ji Gong”, ”Hou Fu” och ”She Ming”) kom tidigare forskare gradvis att tro att de skrevs av samma skribent inom den bredare ”Yin Zhi”-gruppen. Modellen stödde starkt denna uppfattning och fann mycket hög likhet i alla parvisa jämförelser. För ett annat par manuskript, ”Zhi Zheng” och ”Zhi Bang”, hade forskare diskuterat om en enda eller flera skribenter varit inblandade. Nätverkets jämförelser föreslog att sidorna 1–42 i ”Zhi Zheng” utgjorde en distinkt skribentstil, medan sida 43 i ”Zhi Zheng” matchade ”Zhi Bang” nära men inte de tidigare sidorna — bevis för två separata skribenter som inte ingick i någon tidigare definierad kategori.

Vad detta betyder för dåtid och framtid

Kort sagt visar detta arbete att ett kompakt AI-system pålitligt kan avgöra när två små fragment av forntida handskrift sannolikt kommer från samma person, även när det endast ser enstaka tecken. Det kommer inte att ersätta expertbedömningar, men det kan snabbt skanna stora samlingar, flagga sannolika matchningar och ge kvantitativt stöd för eller emot specifika gruppering av strippar. Bortom Tsinghuas samling skulle samma metod kunna anpassas till andra sköra arkiv, från orakelben till Sidenvägsmaterial, och hjälpa historiker och språkvetare att pussla ihop hur idéer rörde sig över tid och rum.

Citering: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8

Nyckelord: bambustrippar, handstilsanalys, djupinlärning, kulturarv, Siamese-nätverk