Clear Sky Science · de

Schreiberidentifikation für poetische Keramik des Changsha-Ofens der Tang-Dynastie mittels dualem Pfad-Multi-Skalen-Global-Attention-Modell

2026-03-11 · Zurück zur Übersicht

Gedichte auf Ton, Geschichten von Menschen

Auf der Oberfläche kleiner Porzellankännchen und Kopfkissen aus der Tang-Dynastie wurden vor mehr als tausend Jahren anmutige Dichtzeilen über noch feinen Glasurauftrag gehaucht. Diese kurzen Verse sind heute nicht nur wegen ihrer Schönheit wertvoll, sondern auch wegen dessen, was sie über die Menschen verraten könnten, die sie schrieben. Bislang beruhte die Zuordnung einer bestimmten Inschrift zu einer bestimmten Hand jedoch auf dem geschulten Blick einiger weniger Expertinnen und Experten. Diese Studie zeigt, wie moderne künstliche Intelligenz helfen kann, die menschliche Hand hinter diesen zerbrechlichen Artefakten zu lesen und damit ein neues Fenster in Alltag, Arbeit und Handel des frühmittelalterlichen China zu öffnen.

Warum diese Gefäße wichtig sind

Der Changsha-Ofen, aktiv während der glanzvollen Tang-Zeit, stellte bunte Keramik her, die mit Malerei, Kalligraphie und Dichtung verziert war. Diese Objekte reisten weit entlang früher Handelsrouten und wurden zu Trägern von Literatur und Geschmack sowie zu praktischen Gebrauchsgegenständen. Ihre Inschriften bewahren nicht nur Text, sondern auch die Energie der Pinselstriche und die Eigenheiten einzelner Schreiber. Die meisten erhaltenen Stücke sind jedoch in Museen und Privatsammlungen verstreut, und hochwertige Bilder sind selten. Es existierte kein öffentliches, standardisiertes Bilddatensatz dieser Inschriften, was es Forschenden erschwerte, Objekte zu vergleichen, digitale Methoden zu prüfen oder grundlegende Fragen zu stellen wie: Hat ein Töpfer-Schreiber die Gedichte auf mehreren Gefäßen verfasst?

Aufbau einer digitalen Bibliothek tangzeitlicher Handschrift

Um das zu adressieren, stellten die Autorinnen und Autoren zuerst eine neue Bildsammlung aus veröffentlichten Katalogen Changsha-Keramik zusammen. Aus 135 einzelnen Artefakten — überwiegend Krüge, Schalen und Kopfkissen mit Poesie oder kurzen Notizen — extrahierten sie sorgfältig 1.865 Einzelzeichenbilder. Da Inschriften auf gekrümmten Töpferflächen liegen, erscheinen Zeichen an den Rändern in Fotografien verzerrt. Das Team nutzte ein spezialisiertes Bildsegmentierungs- und Flächenabwicklungsverfahren, um diese Krümmung zu korrigieren, entfernte anschließend Schmutz und Risse, konvertierte die Bilder in Graustufen, skalierte sie, reduzierte Rauschen und drehte einige Bilder leicht, um die Vielfalt zu erhöhen. Das Ergebnis ist der erste dedizierte Datensatz poetischer Handschrift aus dem Changsha-Ofen — eine Ressource, die künftig Schriftsatzerkennung, Stilanalysen und viele weitere Studien unterstützen kann.

Einem neuronalen Netzwerk stilistische Wahrnehmung beibringen

Mithilfe dieses Datensatzes entwarfen die Forschenden ein Computer-Vision-System, dessen Aufgabe es ist zu entscheiden, ob zwei Zeichenbilder wahrscheinlich von derselben Person geschrieben wurden. Das Modell verarbeitet ein Zeichenpaar über zwei parallele Kanäle, die dieselben Verarbeitungsschritte teilen. Nach grundlegender Filterung durchlaufen beide Bilder ein tiefes neuronales Netzwerk (ResNet-34), das Muster in Strichstärke, Kurvenführung, Abstand und anderen feinen Merkmalen extrahiert. Im Kern des Systems steht ein neues Multi-Skalen-Global-Attention-Modul. Anstatt nur eine feste Detailebene zu betrachten, prüft dieses Modul die Zeichen gleichzeitig auf mehreren Skalen — von grober Struktur bis zu feinen Strichunregelmäßigkeiten — und lernt, wie weit voneinander entfernte Bereiche eines Strichs miteinander in Beziehung stehen. Durch die Kombination dieser Perspektiven erstellt das Modell einen reichen inneren „Fingerabdruck“ des Stils jeder Hand und vergleicht dann die beiden Fingerabdrücke, um einen Ähnlichkeitswert zwischen 0 und 1 auszugeben.

Das System auf die Probe stellen

Das Team verglich mehrere gängige neuronale Netzwerk-Backbones und Attention-Mechanismen und stellte fest, dass ihr duales Netzwerk mit dem neuen Attention-Modul die besten Ergebnisse lieferte. Es erreichte eine Erkennungsgenauigkeit von etwa 97,9 % und übertraf damit deutlich ältere Modelle mit einzelner Skalenaufmerksamkeit. Um zu sehen, was der Algorithmus gelernt hatte, erzeugten die Autorinnen und Autoren Heatmaps, die zeigen, wohin das Netzwerk am genauesten „blickt“. Diese heben Strichwendungen, nach links geneigte Striche und andere Bereiche hervor, in denen Pinsel-Druck und Rhythmus von Person zu Person variieren — ähnlich den Merkmalen, die ein menschlicher Kenner untersuchen würde. Die Forschenden führten anschließend umfangreiche Tests innerhalb einzelner Artefakte und zwischen verschiedenen Artefakten durch. Innerhalb eines einzelnen Gefäßes beurteilte das System die Zeichen durchgehend als hochgradig ähnlich, was die Annahme stützt, dass das Gedicht jedes Gefäßes von einem einzigen Schreiber verfasst wurde, nicht von mehreren.

Neue Hinweise auf antike Handwerker

Das eindrücklichste Ergebnis ergab sich, als das Modell Stücke aus unterschiedlichen Sammlungen verglich. Zwei Keramikkopfkissen mit Liebesthemen in siebenzeichigen Gedichten zeigten eine sehr hohe stilistische Ähnlichkeit, obwohl sie heute in getrennten Institutionen aufbewahrt werden. Archäologische Befunde verorten beide Kissen an derselben Ofenstelle, und Form, dekorative Motive und Themen stimmen eng überein. Das Urteil des Algorithmus — eine 85,8%ige Wahrscheinlichkeit, dass dieselbe Hand beide Inschriften schrieb — stützt die Schlussfolgerung, dass sie von einem einzigen Schreiber stammen. Im Gegensatz dazu zeigten drei ähnliche Weinkrüge mit verwandten mahnenden Versen über Reue niedrige Ähnlichkeitswerte, was auf drei verschiedene Kalligraphen hindeutet, die eine gemeinsame Textformel kopierten. Zusammengenommen zeigen diese Befunde, wie ein KI‑„Blick“ Historikerinnen und Historikern helfen kann, Werkstattorganisation, Arbeitsteilung und Handelspraktiken nachzuzeichnen.

Was das für Vergangenheit und Zukunft bedeutet

Durch die Verbindung sorgfältiger digitaler Bildgebung mit einem ausgefeilten neuronalen Netzwerk verwandelt diese Studie fragile Tintenspuren auf Keramik in quantitative Belege dafür, wer was schrieb. Für die allgemeine Leserschaft ist die zentrale Erkenntnis, dass die Computer-Vision heute individuelle Hände in antiker Kalligraphie fast so zuverlässig unterscheiden kann wie ein menschlicher Experte — jedoch viel schneller und über ein viel größeres Objektensemble hinweg. Das macht es möglich, weltweit verstreute Stücke zu verbinden, die Laufbahnen längst vergessener Handwerker nachzuzeichnen und besser zu verstehen, wie Massenproduktion und persönliche Ausdrucksweise in der Tang-Dynastie koexistierten. Obwohl die Methode nicht perfekt ist und von begrenzten, teils beschädigten Daten abhängt, bietet sie ein wirkungsvolles neues Werkzeug für Museen und Forschende — und ein Modell für den Einsatz von KI bei vielen anderen Formen historischer Handschrift.

Zitation: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5

Schlüsselwörter: antike Handschrift, Keramik der Tang-Dynastie, Schreiberidentifikation, Deep Learning, digitales Erbe