Clear Sky Science · nl

Verificatie van schrijvers op Tsinghua bamboestrips met Siamese netwerken

· Terug naar het overzicht

Oude boeken ontmoeten moderne code

Lang voor papier en schermen schreven Chinese denkers op dunne stroken bamboe. Tegenwoordig vormen deze kwetsbare manuscripten schatkamers voor historici, maar een ogenschijnlijk eenvoudige vraag is verrassend moeilijk te beantwoorden: welke strips zijn door dezelfde hand geschreven? Deze studie combineert archeologie en kunstmatige intelligentie om een digitale assistent te bouwen die onderzoekers kan helpen bepalen wie wat schreef op duizenden, 2.300 jaar oude bamboestrips uit de beroemde collectie van Tsinghua University.

Figure 1
Figure 1.

Waarom het handschrift ertoe doet

De Tsinghua bamboestrips stammen uit de Periode van Strijdende Staten, net vóór China’s eerste keizerrijk. Ze bewaren vroege versies van teksten over politiek, geschiedenis en filosofie die later de traditie vormden of uit die traditie verloren gingen. Om deze geschriften echt te begrijpen, moeten onderzoekers weten hoe de strips gegroepeerd zijn, welke delen tot hetzelfde manuscript behoren en hoeveel schrijvers eraan hebben gewerkt. Traditioneel beantwoorden experts zulke vragen visueel, door soepelheid van lijnen, druk en lay-out te beoordelen. Dit vakmanschap is traag, subjectief en moeilijk schaalbaar naarmate nieuwe vondsten opduiken.

Van streken naar data

De auteurs wilden een computer leren individuele handgeschreven karakters te vergelijken die zijn uitgesneden uit hoge resolutie foto’s van de strips. Ze bouwden eerst een grote beeldverzameling: 15.745 losse karakters van 11 eerder geïdentificeerde schrijvers, gebaseerd op consensus uit paleografische studies. Met professionele beeldverwerkingssoftware verwijderden ze achtergrondruis, isoleerden elk karakter binnen een rechthoek en filterden beschadigde of overlappende tekens weg. Vervolgens vergrootten ze de kleinere klassen—schrijvers met slechts enkele overgebleven karakters—met eenvoudige trucs zoals spiegelen, roteren, bijsnijden en het toevoegen van ruis, zodat het algoritme niet zou bevooroordeeld raken ten gunste van meer voorkomende stijlen.

Een tweelingnetwerk dat naar gelijkenis zoekt

In plaats van de computer te vragen de schrijver van elk karakter te benoemen, stelden de onderzoekers een eenvoudiger maar flexibeler vraag: komen deze twee afbeeldingen van dezelfde hand? Hiervoor gebruikten ze een “Siamese” neuraal netwerk, een paar identieke beeldverwerkingsarmen die parameters delen. Elke arm zet een karakterafbeelding om in een compact numeriek vingerafdrukje. Het systeem meet vervolgens de afstand tussen de twee vingerafdrukken: kleine afstanden wijzen op dezelfde schrijver, grotere op verschillende schrijvers. In het hart van elke arm bevindt zich een opgewaardeerd lichtgewicht model genaamd MobileNet_V3+, versterkt met een aandachtmechanisme dat leert de meest veelzeggende visuele kenmerken te benadrukken—subtiele krommingen, lijnkracht of favorieten manieren om delen van karakters te vormen—terwijl minder nuttige details worden weggefilterd.

Figure 2
Figure 2.

Hoe goed het systeem presteert

Op de Tsinghua-dataset oordeelde de beste versie van het model in ongeveer 90% van de gevallen correct of paren karakters door dezelfde schrijver waren gemaakt, met een zeer hoge score op een standaard test voor tweecategorie-onderscheiding. Het overtrof verschillende zwaardere beeldherkenningssystemen, zoals ResNet, VGG en Vision Transformers, die geneigd waren over te fitten op de beperkte data of de fijne stilistische aanwijzingen te missen die voor deze taak nodig zijn. Visuele inspecties van de ‘aandachtskaarten’ van het netwerk toonden dat, naarmate de training vorderde, het model stopte met kijken naar de algemene silhouet en zich in plaats daarvan richtte op cruciale lijnenegmenten—net als een menselijke expert.

Helpen echte wetenschappelijke debatten op te lossen

Om te onderzoeken of het hulpmiddel buiten het lab nuttig is, pasten de auteurs het toe op verschillende bamboemanuscripten waarvan het auteurschap al jaren ter discussie stond. Voor drie teksten (‘Ji Gong’, ‘Hou Fu’ en ‘She Ming’) kwamen eerdere onderzoekers geleidelijk tot de conclusie dat ze door dezelfde schrijver binnen de bredere ‘Yin Zhi’-groep waren geschreven. Het model ondersteunde deze opvatting sterk en vond zeer hoge gelijkenissen in alle combinaties. Voor een ander paar manuscripten, ‘Zhi Zheng’ en ‘Zhi Bang’, werd gedebatteerd of één of meerdere schrijvers betrokken waren. De vergelijkingen van het netwerk suggereerden dat pagina’s 1–42 van ‘Zhi Zheng’ één onderscheidende schrijversstijl vormden, terwijl pagina 43 van ‘Zhi Zheng’ nauw aansloot bij ‘Zhi Bang’ maar niet bij de eerdere pagina’s—bewijs voor twee afzonderlijke schrijvers die niet tot een eerder gedefinieerde categorie behoorden.

Wat dit betekent voor verleden en toekomst

In eenvoudige bewoordingen laat dit werk zien dat een compact AI-systeem betrouwbaar kan aangeven wanneer twee kleine fragmenten van oud handschrift waarschijnlijk van dezelfde persoon zijn, zelfs wanneer het slechts enkele karakters ziet. Het zal het oordeel van experts niet vervangen, maar het kan snel grote collecties scannen, waarschijnlijke overeenkomsten signaleren en kwantitatieve ondersteuning bieden voor of tegen bepaalde groeperingen van strips. Buiten de Tsinghua-voorraad kan dezelfde methode worden aangepast aan andere kwetsbare registers, van orakelbotten tot Zijderoute-rollen, en historici en taalkundigen helpen uitzoeken hoe ideeën zich door tijd en ruimte bewogen.

Bronvermelding: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8

Trefwoorden: bamboestrips, handschriftanalyse, diep leren, cultureel erfgoed, Siamese netwerk