Clear Sky Science · nl

Informatieverwerking van orakelbotinscripties: een uitgebreid overzicht

· Terug naar het overzicht

Oude botten, moderne vragen

Meer dan 3.000 jaar geleden kerfden waarzeggers in China vragen voor hun heersers in schildpadden- en runderschedels, om ze vervolgens met hitte te laten barsten en zo voortekenen te lezen. Deze orakelbotinscripties zijn het vroegst bekende Chinese schrift en bieden een zeldzaam venster op politiek, religie en dagelijks leven in de Bronstijd. Tegenwoordig zijn de botten echter zwaar beschadigd, het schrift moeilijk leesbaar en blijven veel tekens onontcijferd. Dit artikel legt uit hoe nieuwe golven van kunstmatige intelligentie de manier veranderen waarop onderzoekers deze fragiele sporen uit het verleden zuiveren, reconstrueren, lezen en interpreteren, en welke uitdagingen nog in de weg staan.

Figure 1
Figure 1.

Van hand en oog naar silicium en code

Gedurende het grootste deel van de vorige eeuw konden orakelbotten slechts door een kleine kring van experts worden bestudeerd, die met veel geduld inktafdrukken, traceringen en foto’s onderzocht. Ze stelden omvangrijke gedrukte catalogi samen, deden voorstellen voor de lezing van individuele tekens en voerden debatten over datering en groepering van inscripties. Dit werk legde de basis van het vakgebied, maar was traag, moeilijk reproduceerbaar en sterk afhankelijk van het geheugen en oordeel van individuele onderzoekers. Met de komst van computers begonnen onderzoekers rubbings te digitaliseren en eenvoudige beeldverwerkingstechnieken toe te passen, zoals contrastverbetering en randdetectie. Deze vroege hulpmiddelen maakten botten beter zichtbaar en makkelijker te delen, maar behandelden tekens als louter vormen, niet als betekenisvol schrift.

Diep leren betreedt de archieven

De opkomst van deep learning veranderde het speelveld. Convolutionele neurale netwerken en transformers, eerst verfijnd op alledaagse foto’s, werden opnieuw getraind om tekens op rumoerige rubbings te herkennen, ze in categorieën te sorteren en zelfs te helpen bij het samenvoegen van gebroken fragmenten die ooit tot hetzelfde bot behoorden. Om deze datahongerige modellen te voeden, stelden teams tientallen gespecialiseerde datasets samen: sommige richten zich op het identificeren van elk teken in een rubbing, andere op het classificeren van uitgeknipte glyphs, het koppelen van radicalen en componenten, of het samenbrengen van oude vormen met latere schriften. De data weerspiegelen echter de historische realiteit: een paar veelvoorkomende tekens komen duizenden keren voor, terwijl veel zeldzame of onontcijferde tekens slechts één keer opduiken. Onderzoekers reageren met slimme data-augmentatie, generatieve modellen die nieuwe voorbeelden synthetiseren, en trainingsschema’s ontworpen om tekens te herkennen op basis van slechts enkele — of geen — bekende voorbeelden.

Machines leren bruggen te slaan tussen visie en betekenis

In de nieuwste fase worden grote multimodale modellen die visie en taal combineren aangepast aan orakelbotten. In plaats van alleen maar te signaleren waar tekens zich bevinden, proberen deze systemen te koppelen hoe een glyph eruitziet aan wat het zou kunnen betekenen, vergelijkbaar met hoe een menselijke paleograaf te werk gaat. Nieuwe benchmarks testen of zulke modellen tekens kunnen herkennen, fragmenten weer kunnen samenvoegen, vergelijkbare inscripties kunnen terugvinden en plausibele lezingen kunnen voorstellen. Sommige kaders proberen oude tekens direct te koppelen aan moderne Chinese karakters en de visuele evolutie over eeuwen te traceren; anderen verbinden picturale tekens met afbeeldingen van echte objecten; weer andere pogen volledige tekstuele verklaringen te geven van wat een waarzegging zou kunnen zeggen. Agentachtige systemen gaan verder door meerdere tools en databases te orkestreren en gebruikers te helpen zoeken in beelden, transcripties en wetenschappelijke aantekeningen in één workflow.

Figure 2
Figure 2.

Data, evaluatie en de puzzel van gebroken geschiedenis

Ondanks de snelle vooruitgang benadrukt het overzicht hardnekkige obstakels. Veel van de beste beeldcollecties en 3D-scans zitten in musea of particuliere archieven en zijn niet vrij beschikbaar, wat het moeilijk maakt methoden eerlijk te vergelijken of echt algemene modellen te trainen. Zelfs openbare datasets hebben vaak lange-staart klassenverdelingen, inconsistente labels of lage beeldkwaliteit. Standaard prestatienormen geleend uit objectdetectie of handschriftherkenning vatten misschien niet samen wat historici werkelijk belangrijk vinden — bijvoorbeeld of een model twee geaccepteerde varianten van hetzelfde teken door elkaar haalt, of dat de voorgestelde lezing respecteert hoe een teken is opgebouwd uit kleinere delen. Menselijke evaluatie is even gefragmenteerd: verschillende studies betrekken verschillende soorten experts, stellen verschillende vragen en rapporteren zelden in genoeg detail om hun tests te repliceren.

Waar oud schrift de toekomst van AI ontmoet

Om vooruitgang te boeken pleiten de auteurs voor rijkere, beter gedocumenteerde datasets; evaluatiemethoden die structureel en semantisch begrip belonen, niet alleen pixelniveau-overeenkomsten; en nauwere samenwerking tussen technologen en specialisten in vroeg Chinees schrift. Zij schetsen tekst-naar-beeldgeneratoren die realistische orakelstijltekens uit beschrijvingen kunnen produceren, foundation-modellen die specifiek op oude schriften zijn getraind, multi-agent systemen die concurrerende lezingen bespreken en verfijnen, en zelfs 3D-reconstructies die de oorspronkelijke vorm van gebroken botten herstellen. In eenvoudige bewoordingen is de conclusie van het artikel dat AI orakelbotten niet zelfstandig zal "oplossen", maar wel een krachtige partner kan worden — deskundige inzichten kan versterken, enorme archieven doorzoekbaar kan maken en de stemmen uit de Bronstijd voor een veel groter publiek kan openen.

Bronvermelding: Chen, Z., Hua, W., Li, J. et al. Oracle bone inscriptions information processing: a comprehensive survey. npj Herit. Sci. 14, 220 (2026). https://doi.org/10.1038/s40494-026-02511-w

Trefwoorden: orakelbotinscripties, oud-Chinese schrift, digitale geesteswetenschappen, kunstmatige intelligentie, multimodale modellen