Clear Sky Science · de

Informationsverarbeitung von Orakelknochenschriften: ein umfassender Überblick

· Zurück zur Übersicht

Alte Knochen, moderne Fragen

Vor mehr als 3.000 Jahren ritten Wahrsager in China Fragen an ihre Herrscher in Schildkrötenpanzer und Rinderknochen und spalteten sie dann mit Hitze, um Omen zu lesen. Diese Orakelknochenschriften sind die frühesten bekannten chinesischen Schriftzeugnisse und ein seltener Einblick in Politik, Religion und Alltagsleben der Bronzezeit. Heute sind die Knochen jedoch stark zerstört, die Schrift schwer lesbar und viele Zeichen weiterhin unentziffert. Dieser Artikel erklärt, wie neue Wellen der künstlichen Intelligenz die Art und Weise verändern, wie Forscher diese fragilen Spuren der Vergangenheit säubern, rekonstruieren, lesen und interpretieren, und welche Herausforderungen dabei noch bestehen.

Figure 1
Figure 1.

Von Hand und Auge zu Silizium und Code

Während des größten Teils des letzten Jahrhunderts konnten Orakelknochen nur von einem kleinen Kreis von Spezialisten untersucht werden, die mühsam Tuschabdrücke, Durchzeichnungen und Fotografien analysierten. Sie stellten umfangreiche gedruckte Kataloge zusammen, schlugen Lesarten einzelner Zeichen vor und stritten darüber, wie Inschriften datiert und gruppiert werden sollten. Diese Arbeit legte das Fundament des Fachgebiets, war jedoch langsam, schwer reproduzierbar und stark von der persönlichen Erinnerung und dem Urteil jedes Forschers abhängig. Mit dem Aufkommen von Computern begannen Forscher, Abreibungen zu digitalisieren und grundlegende Bildverarbeitungswerkzeuge wie Kontrastverstärkung und Kantenerkennung anzuwenden. Diese frühen Hilfsmittel machten die Knochen leichter sichtbar und teilbar, behandelten Zeichen aber weiterhin als bloße Formen und nicht als sinntragende Schrift.

Tiefes Lernen betritt die Archive

Der Aufstieg des Deep Learning veränderte die Landschaft. Konvolutionale neuronale Netze und Transformer, zunächst an Alltagsfotografien geschult, wurden umtrainiert, um Zeichen in verrauschten Abreibungen zu erkennen, sie in Kategorien zu sortieren und sogar dabei zu helfen, zerbrochene Fragmente zusammenzufügen, die einst zum selben Knochen gehörten. Um diese datenhungrigen Modelle zu füttern, stellten Teams Dutzende spezialisierter Datensätze zusammen: Einige konzentrierten sich darauf, jedes Zeichen in einer Abreibung zu identifizieren, andere auf die Klassifikation zugeschnittener Glypheausschnitte, das Verknüpfen von Radikalen und Komponenten oder das Paaren alter Formen mit späteren Schriften. Die Daten spiegeln jedoch die historische Realität wider: Einige häufige Zeichen tauchen tausendfach auf, während viele seltene oder unentzifferte Zeichen nur einmal vorkommen. Forscher reagieren mit cleverer Datenaugmentation, generativen Modellen, die neue Beispiele synthetisieren, und Trainingsschemata, die darauf ausgelegt sind, Zeichen aus nur wenigen — oder gar keinen — bekannten Proben zu erkennen.

Maschinen beibringen, Vision und Bedeutung zu verbinden

In der jüngsten Phase werden große multimodale Modelle, die Vision und Sprache kombinieren, auf Orakelknochen adaptiert. Anstatt nur zu lokalisieren, wo Zeichen stehen, versuchen diese Systeme, das Aussehen einer Glyphe mit ihrer möglichen Bedeutung zu verknüpfen — ähnlich wie ein menschlicher Paläograph. Neue Benchmarks prüfen, ob solche Modelle Zeichen erkennen, Fragmente wieder zusammenfügen, ähnliche Inschriften abrufen und plausible Lesarten vorschlagen können. Manche Frameworks versuchen, alte Zeichen direkt modernen chinesischen Schriftzeichen zuzuordnen und damit visuelle Entwicklungen über Jahrhunderte nachzuzeichnen; andere verbinden bildhafte Zeichen mit Fotos realer Gegenstände; wieder andere versuchen vollständige textliche Erklärungen dessen zu liefern, was eine Weissagungszeile aussagen könnte. Agentenartige Systeme gehen noch weiter, indem sie mehrere Werkzeuge und Datenbanken orchestrieren und Nutzern helfen, in einem Workflow über Bilder, Transkriptionen und wissenschaftliche Notizen hinweg zu suchen.

Figure 2
Figure 2.

Daten, Bewertung und das Rätsel der gebrochenen Geschichte

Trotz rascher Fortschritte hebt die Übersicht hartnäckige Hindernisse hervor. Viele der besten Bildersammlungen und 3D-Scans liegen in Museen oder privaten Archiven und sind nicht frei zugänglich, was den fairen Vergleich von Methoden oder das Training wirklich allgemeiner Modelle erschwert. Selbst öffentliche Datensätze weisen oft langschwänzige Klassenverteilungen, inkonsistente Labels oder schlechte Bildqualität auf. Standard-Performance-Metriken, die aus der Objekterkennung oder Handschriftenerkennung übernommen wurden, erfassen möglicherweise nicht das, was Historikern wirklich wichtig ist — etwa, ob ein Modell zwei akzeptierte Varianten desselben Zeichens verwechselt oder ob seine vorgeschlagene Lesart respektiert, wie ein Zeichen aus kleineren Teilen aufgebaut ist. Die menschliche Bewertung ist ebenso fragmentiert: Verschiedene Studien binden unterschiedliche Expertentypen ein, stellen verschiedene Fragen und berichten selten so detailliert, dass andere ihre Tests reproduzieren können.

Wo alte Schrift auf zukünftige KI trifft

Um voranzukommen, plädieren die Autorinnen und Autoren für reichhaltigere, besser dokumentierte Datensätze; Evaluationsmethoden, die strukturelles und semantisches Verständnis belohnen und nicht nur Pixelübereinstimmungen; sowie für engere Zusammenarbeit zwischen Technologen und Spezialisten für frühe chinesische Schrift. Sie sehen vorstellbar, dass Text-zu-Bild-Generatoren realistische orakelähnliche Zeichen aus Beschreibungen erzeugen, Foundation-Modelle speziell auf alten Schriften trainiert werden, Multi-Agenten-Systeme konkurrierende Lesarten debattieren und verfeinern und sogar 3D-Rekonstruktionen die ursprüngliche Form zerbrochener Knochen wiederherstellen. Kurz gesagt lautet die Schlussfolgerung des Artikels: KI wird die Orakelknochen nicht allein „lösen“, kann aber zu einem mächtigen Partner werden — sie verstärkt Expertenwissen, macht gewaltige Archive durchsuchbar und öffnet Stimmen der Bronzezeit einem viel breiteren Publikum.

Zitation: Chen, Z., Hua, W., Li, J. et al. Oracle bone inscriptions information processing: a comprehensive survey. npj Herit. Sci. 14, 220 (2026). https://doi.org/10.1038/s40494-026-02511-w

Schlüsselwörter: Orakelknochenschriften, altchinesische Schrift, digitale Geisteswissenschaften, künstliche Intelligenz, multimodale Modelle