Clear Sky Science · de

Authentifizierung von Tsinghua-Bambusstreifen-Schreibern mit Siamese-Netzwerken

2026-03-11 · Zurück zur Übersicht

Alte Bücher treffen modernen Code

Lange vor Papier und Bildschirmen schrieben chinesische Gelehrte auf schmalen Bambusstreifen. Heute sind diese zerbrechlichen Manuskripte für Historiker wahre Fundgruben, doch eine grundlegende Frage ist überraschend schwer zu beantworten: Welche Streifen wurden von derselben Hand geschrieben? Diese Studie verbindet Archäologie und künstliche Intelligenz, um einen digitalen Assistenten zu entwickeln, der Forschern hilft, herauszufinden, wer was auf Tausenden von 2.300 Jahre alten Bambusstreifen aus der berühmten Sammlung der Tsinghua-Universität geschrieben hat.

Warum die Handschrift wichtig ist

Die Tsinghua-Bambusstreifen stammen aus der Zeit der Streitenden Reiche, kurz vor Chinas erstem Kaiserreich. Sie enthalten frühe Fassungen von Texten zu Politik, Geschichte und Philosophie, die entweder die spätere Tradition prägten oder daraus verloren gingen. Um diese Schriften wirklich zu verstehen, müssen Forscher wissen, wie die Streifen gruppiert wurden, welche Teile zu demselben Manuskript gehören und wie viele Schreiber daran gearbeitet haben. Traditionell beantworten Experten solche Fragen mit dem bloßen Auge, indem sie Strichführung, Druck und Layout beurteilen. Dieses Handwerk ist langsam, subjektiv und schwer zu skalieren, wenn neue Funde auftauchen.

Striche in Daten verwandeln

Die Autoren wollten dem Computer beibringen, einzelne handgeschriebene Zeichen zu vergleichen, die aus hochauflösenden Fotos der Streifen ausgeschnitten wurden. Dafür bauten sie zunächst eine große Bildsammlung auf: 15.745 Einzelzeichen von 11 zuvor identifizierten Schreibern, basierend auf konsensbasierten paläographischen Studien. Mit professioneller Bildbearbeitungssoftware entfernten sie Hintergrundrauschen, isolierten jedes Zeichen in einem Rechteck und filterten beschädigte oder überlappende Zeichen aus. Kleinere Klassen — Schreiber mit nur wenigen erhaltenen Zeichen — vergrößerten sie durch einfache Tricks wie Spiegeln, Drehen, Zuschnitt und Hinzufügen von Rauschen, damit der Algorithmus nicht zugunsten häufigerer Stile verzerrt würde.

Ein Zwillingsnetzwerk, das nach Ähnlichkeit sucht

Statt dem Computer zu sagen, wer ein Zeichen geschrieben hat, stellten die Forscher eine einfachere, aber flexiblere Frage: Stammt dieses Paar von Bildern aus derselben Hand? Dazu verwendeten sie ein „Siamese“-Neuralnetzwerk, ein Paar identischer Bildverarbeitungszweige, die Parameter teilen. Jeder Zweig wandelt ein Zeichenbild in einen kompakten numerischen Fingerabdruck um. Das System misst dann den Abstand zwischen den beiden Fingerabdrücken: kleine Abstände deuten auf denselben Schreiber hin, größere auf verschiedene Schreiber. Im Kern jedes Zweigs steht ein aufgefrischtes, leichtgewichtiges Modell namens MobileNet_V3+, erweitert um einen Aufmerksamkeitsmechanismus, der lernt, die aussagekräftigsten visuellen Merkmale zu betonen — subtile Bögen, Strichstärke oder bevorzugte Formen von Zeichenbestandteilen — und weniger nützliche Details zu unterdrücken.

Wie gut das System funktioniert

Auf dem Tsinghua-Datensatz entschied die beste Modellvariante in etwa 90 % der Fälle korrekt, ob Zeichenpaare vom selben Schreiber stammen, und erzielte einen sehr hohen Wert in einem Standardtest zur Unterscheidung in zwei Kategorien. Es übertraf mehrere schwergewichtigere Bilderkennungssysteme wie ResNet, VGG und Vision Transformers, die dazu neigten, entweder bei den begrenzten Daten zu überanpassen oder die feinen stilistischen Hinweise für diese Aufgabe zu übersehen. Visuelle Inspektionen der Aufmerksamkeitskarten des Netzes zeigten, dass das Modell im Verlauf des Trainings aufhörte, die Gesamtumrisse zu betrachten, und stattdessen auf zentrale Strichsegmente fokussierte — ähnlich wie ein menschlicher Experte.

Bei der Klärung wirklicher wissenschaftlicher Debatten helfen

Um zu prüfen, ob das Werkzeug über das Labor hinaus nützlich ist, wendeten die Autoren es auf mehrere Bambusmanuskripte an, deren Urheberschaft seit Jahren umstritten ist. Für drei Texte („Ji Gong“, „Hou Fu“ und „She Ming“) kamen frühere Forscher allmählich zu der Ansicht, dass sie von demselben Schreiber innerhalb der größeren „Yin Zhi“-Gruppe stammen. Das Modell stützte diese Sicht stark und fand durchgehend sehr hohe Ähnlichkeiten. Bei einem anderen Manuskriptpaar, „Zhi Zheng“ und „Zhi Bang“, stritten Forscher darüber, ob ein einzelner oder mehrere Schreiber beteiligt waren. Die Netzvergleiche deuteten darauf hin, dass die Seiten 1–42 von „Zhi Zheng“ einen einheitlichen schreiberischen Stil bilden, während Seite 43 von „Zhi Zheng“ sehr stark mit „Zhi Bang“ übereinstimmt, aber nicht mit den früheren Seiten — ein Hinweis auf zwei verschiedene Schreiber, die keiner zuvor definierten Kategorie angehörten.

Was das für Vergangenheit und Zukunft bedeutet

Einfach ausgedrückt zeigt diese Arbeit, dass ein kompaktes KI-System zuverlässig feststellen kann, ob zwei winzige Fragmente alter Handschrift wahrscheinlich derselben Person entstammen, selbst wenn es nur einzelne Zeichen sieht. Es wird das Urteil von Experten nicht ersetzen, kann aber große Sammlungen schnell durchsuchen, wahrscheinliche Übereinstimmungen markieren und quantitative Unterstützung für oder gegen bestimmte Gruppierungen von Streifen liefern. Über den Tsinghua-Bestand hinaus ließe sich derselbe Ansatz auf andere fragile Quellen anwenden, von Orakelknochen bis zu Seidenstraßen-Rollen, und Historikern und Sprachwissenschaftlern helfen, nachzuvollziehen, wie sich Ideen über Zeit und Raum hinweg verbreiteten.

Zitation: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8

Schlüsselwörter: Bambusstreifen, Handschriftenanalyse, Deep Learning, Kulturerbe, Siamese-Netzwerk