Clear Sky Science · de

Prism-OBI: ein neues Rahmenwerk zur Erkennung von Orakelknochenschriften durch visuelle Wahrnehmung und Merkmalsentkopplung

· Zurück zur Übersicht

Alte Hinweise in gesplitterten Knochen

Vor mehr als dreitausend Jahren ritten Menschen im alten China Fragen an die Götter in Tierknochen und Schildkrötenpanzern — damit entstanden die frühesten bekannten chinesischen Schriftzeichen. Heute sind diese Orakelknochenschriften wertvolle Hinweise zur früher Geschichte, doch die meisten überdauern nur als abgenutzte, rissige Fragmente, die selbst für Fachleute extrem schwer zu lesen sind. Dieses Papier stellt Prism-OBI vor, ein neues System der künstlichen Intelligenz, das entwickelt wurde, um durch Schäden hindurchzusehen, bedeutungsvolle Striche von geologischen Störungen zu trennen und Forschern dabei zu helfen, diese fragilen Aufzeichnungen in großem Maßstab zu erschließen.

Warum alte Knochen schwer zu lesen sind

Orakelknochen haben Jahrtausende unter der Erde verbracht, wurden von Boden zusammengedrückt, durch wechselndes Wetter durchtränkt und getrocknet und beim Ausgraben gebrochen. Die Schrift ist oft schwach, zerrissen oder fehlt ganz, und die Knochenoberflächen sind voller Risse und Flecken, die den eingeritzten Strichen täuschend ähnlich sehen. Traditionelle Ansätze beruhten entweder auf Experten, die jedes Zeichen mühsam von Hand verglichen, oder auf Standard-Zeichenerkennung für sauberen, modernen Drucktext. Beide Methoden stoßen an ihre Grenzen, wenn ein einzelnes Zeichen durch einen Riss geteilt, teilweise erodiert oder von verschiedenen Schreibern in leicht unterschiedlichen Formen ausgeführt wurde. Infolgedessen bleibt ein Großteil dieses Materials untergenutzt — weil allein die Identifikation, welches Zeichen welches ist, schwierig ist.

Computern beibringen, den Schaden zu übersehen

Prism-OBI geht dieses Problem an, indem die Erkennung in zwei sorgfältig koordinierte Stufen zerlegt wird, statt ein großes End-to-End-Modell zu verwenden. In der ersten Stufe konzentriert sich das System nur darauf, wo sich Zeichen auf einem Abzug eines Knochens befinden, nicht darauf, was sie bedeuten. Bevor irgendeine KI das Bild betrachtet, verbessert ein zweistufiger Bereinigungsprozess den Kontrast und filtert sprenkeliges Scanrauschen heraus, damit die Striche deutlicher hervortreten. Der bereinigte Abzug gelangt dann in einen angepassten Detektor, der auf einem schnellen Objekterkennungsnetz basiert und zu einem „Degradation-aware“-Modell umgestaltet wurde. Er trennt grobe Formen von feinen Details, hebt wahrscheinliche Strichmuster hervor, blendet zufällige Risse herunter und kombiniert Informationen über mehrere Größen, sodass sowohl winzige als auch größere Zeichen zuverlässig erkannt werden können. Die Ausgabe dieser Stufe ist eine Menge enger Kästchen um jeden vermuteten Zeichenausschnitt.

Figure 1
Figure 1.

Von ausgeschnittenen Zeichen zu erkannten Schriftzeichen

In der zweiten Stufe wird jeder ausgeschnittene Zeichenausschnitt auf ein standardisiertes Quadrat skaliert und in einen tiefen neuronalen Klassifikator eingespeist, der von einem weit verbreiteten Vision-Modell abgeleitet ist. Dieser Klassifikator ist darauf spezialisiert, hunderte subtil unterschiedliche Zeichen der OBC306-Datensatzes auseinanderzuhalten, der über 300.000 Orakelknochenzeichen in 306 Kategorien enthält, jeweils verknüpft mit einem modernen chinesischen Äquivalent. Da der Detektor bereits die schwere Arbeit des Bereinigens und Isolierens der Zeichen erledigt hat, kann sich der Klassifikator auf feine Unterschiede in Strichform und -anordnung konzentrieren — etwa winzige Haken, Brüche oder Kreuzungen — statt im Hintergrundrauschen des ursprünglichen Abzugs zu kämpfen. Tests zeigen, dass diese Kombination aus fokussiertem Detektor und starkem Klassifikator eine höhere Erkennungsgenauigkeit liefert als einfachere, einstufige Systeme, während sie dennoch schnell genug für nahezu Echtzeitanwendungen läuft.

Figure 2
Figure 2.

Blick unter die Haube des neuen Detektors

Im Hintergrund verwendet der Detektor von Prism-OBI mehrere maßgeschneiderte Tricks, um mit stark degradierten Artefakten umzugehen. Ein Modul teilt das visuelle Signal in Niederfrequenzkomponenten (Gesamtumrisse) und Hochfrequenzkomponenten (scharfe Kanten), sodass das Modell grobe Formen und feine Strichspitzen unterschiedlich behandeln kann, und wendet anschließend Aufmerksamkeitsmechanismen an, um konsistente Strichmuster gegenüber zufälligen Fissuren hervorzuheben. Ein anderes Modul erstellt eine Pyramide von Ansichten in unterschiedlichen Skalen und lernt, wie sehr jeder Maßstab zu vertrauen ist, was die Erkennung sowohl winziger als auch größerer Zeichen verbessert, ohne vom Rauschen überwältigt zu werden. Ein drittes Modul lernt, Merkmale aus verschiedenen Netzwerkebenen zu gewichten anstatt sie einfach zu stapeln, wodurch informative Signale erhalten und unzuverlässige gedämpft werden. Schließlich kodiert der Erkennungs-Head explizit horizontale und vertikale Positionen, was in dichten Layouts wichtig ist, wo benachbarte Zeichen sonst ineinander verschwimmen würden.

Was die Ergebnisse fürs kulturelle Erbe bedeuten

Auf einem standardisierten Datensatz zur Orakelknochendetektion verbessert der erweiterte Detektor deutlich Präzision, Recall und die Gesamtqualität der Begrenzungsboxen gegenüber dem Basismodell und reduziert sowohl übersehene Zeichen als auch Fehlalarme durch Risse. In Kombination mit dem Klassifikator erreicht das vollständige Prism-OBI-Rahmenwerk starke Erkennungsleistungen und verarbeitet dabei etwa 32 Bilder pro Sekunde auf einer Laptop-GPU. Erste qualitative Tests zeigen sogar, dass derselbe Detektor ohne Nachtraining Zeichen in anderen antiken Schriften wie Bronzeschriften und Siegelschrift sinnvoll lokalisieren kann, wenngleich für beste Ergebnisse noch Feintuning erforderlich ist. Für Nicht-Spezialisten ist die zentrale Erkenntnis, dass Prism-OBI einen praktikablen, erweiterbaren Weg bietet, stark beschädigte antike Schriften automatisch zu lesen. Indem es sauber zwischen „wo steht die Schrift?“ und „was sagt sie?“ trennt, verwandelt das System unordentliche, gebrochene Knochenoberflächen in strukturierte, durchsuchbare Texte und hilft Historikern und Archäologen, die frühesten schriftlichen Aufzeichnungen der Menschheit schneller und gründlicher zu untersuchen als je zuvor.

Zitation: Li, J.W., He, J.R., Wu, J.R. et al. Prism-OBI: a novel framework for oracle bone inscription recognition via visual perception and feature decoupling. npj Herit. Sci. 14, 218 (2026). https://doi.org/10.1038/s40494-026-02493-9

Schlüsselwörter: Orakelknochenschriften, Erkennung antiker Schriften, Deep Learning, Digitalisierung kulturellen Erbes, Computer Vision