Clear Sky Science · sv

Mänskligt–dator-samarbete för dechiffrering av orakelbenskiftningar med generativa adversariella nätverk

· Tillbaka till index

Forntida skrift möter moderna maskiner

För mer än tre tusen år sedan ristade spåmän i Kina frågor om krig, väder och skördar på sköldpaddsskal och djurben. Idag är dessa orakelbensinristningar en skattkammare för att förstå hur kinesisk skrift och det tidiga kinesiska samhället tog form. Men många av dessa små, väderbitna symboler är fortfarande otydliga och för många för att ett fåtal experter ska hinna ta sig an dem. Denna artikel visar hur artificiell intelligens, i samarbete med forskare, kan hjälpa till att läsa dessa forntida repor genom att omvandla dem till modernstilade kinesiska tecken.

Från bilder på ben till bilder för en dator

Orakelbenskriften är ovanligt visuell. Tidiga skrivare ristade förenklade bilder av tigrar, solar, människor och verktyg direkt i ben, så varje tecken är nästan som en liten teckning. Författarna utnyttjar detta genom att betrakta varje tecken som en bild snarare än som en rad kod eller text. De samlar över tusen bildpar: på ena sidan ett fotograferat orakelbensglyf, på andra dess kända moderna kinesiska motsvarighet. Genom att ändra storlek på och rengöra dessa bilder bygger de ett standardiserat bildbibliotek som en dator kan lära sig av, och förvandlar det ålderdomliga problemet med dechiffrering till en modern bild-till-bild-översättningsuppgift.

Figure 1
Figure 1.

Två digitala konstnärer: kompletterande AI-modeller

Teamet tränar två besläktade men olika typer av generativa adversariella nätverk (GAN), AI-modeller som lär sig skapa realistiska bilder genom att ställa en ”generator” mot en ”kritiker”. En modell, baserad på ett system som kallas Pix2Pix, lär sig från parade exempel: den ser ett benskriftstecken och det exakta moderna tecknet det ska bli. Denna modell är skicklig på att producera skarpa, välformade modernstilade glyfer som nära matchar de förväntade formerna. Den andra modellen, baserad på CycleGAN, är utformad för att fungera även när exemplen inte är perfekt matchade. Den tenderar att bevara den ursprungliga skelettstrukturen och stilen hos orakelskriften samtidigt som den försiktigt normaliserar mot moderna former. Tillsammans erbjuder de två modellerna olika ”tolkningar” av hur ett gammalt, skadat glyf kan ha sett ut i en mer regelbunden, läsbar stil.

Test av maskinerna och jämförelse av alternativ

För att kontrollera om systemen gör mer än att bara rita snygga bilder genomför författarna en noggrann uppsättning tester. De håller tillbaka 160 kända orakel–moderna par som AI:n aldrig ser under träningen och ber sedan varje modell att förutsäga de moderna tecknen utifrån orakelbilderna. De jämför resultaten med de verkliga svaren med hjälp av standardmått för bildkvalitet och struktur, och granskar även resultaten visuellt. I en bredare jämförelse ställer de sina två GANs mot andra populära bildmetoder, inklusive diffusionsmodeller, transformatorer och klassiska U‑Net‑nätverk. GAN-paret står ut: Pix2Pix producerar de klaraste, mest läsbara tecknen, medan CycleGAN ger konservativa, strukturbevarande alternativ. Andra metoder suddar ofta ut streck, bryter tecknens skelett eller genererar former som inte längre liknar skrift alls, vilket gör dem mindre användbara för seriös dechiffrering.

Människor i loopen: samarbete, inte ersättning

Studiens kärna är inte AI ensamt utan ett strukturerat partnerskap mellan maskiner och experter. För 150 inskriptioner vars betydelser tidigare var okända genererar modellerna flera kandidatmodern-glyfer. Mänskliga specialister väljer sedan lovande kandidater och ritar om saknade eller osäkra streck för hand, styrda både av AI:s förslag och av deras kunskap om språkets historia och vardagslivet som skildras i texterna. I detaljerade fallstudier—som att föreslå att ett tidigare okänt glyf betyder ”grotta” eller ”lya”—kombinerar författarna AI‑suggesterade former, jämförelser med besläktade tecken och historisk information om forntida bostäder och ritualer. De genomför också kontrollerade experiment på 160 kända fall och jämför tre lägen: AI ensam, människor som ritar från början, och människor som förfinar AI‑utkast. Den kombinerade metoden producerar konsekvent bilder som ligger närmare de sanna tecknen, bedömda både av numeriska bildpoäng och av expertpaneler, samtidigt som den sparar tid och kraft för forskarna.

Figure 2
Figure 2.

Varför detta är viktigt för historia och arv

För icke‑specialister är vinsten tydlig: varje nydechiffrerat orakelbens-tecken skärper vår bild av det tidiga kinesiska livet, från kungliga offer till jordbruk och sjukdomar. Detta arbete visar att AI kan göra mer än att känna igen modern handstil eller generera konst; det kan hjälpa till att låsa upp de tidigaste lagren av skriven kultur när det paras med noggrant mänskligt omdöme. Istället för att ersätta experter fungerar systemet som en intelligent assistent som föreslår former, påskyndar tidsödande omlinjer och gör hela processen mer transparent och mätbar. Författarna menar att detta människa–dator‑partnerskap skulle kunna tillämpas på andra forntida skriftsystem och skadade dokument, och förvandla sköra märken på ben, lera eller pergament till läsbara berättelser om hur människor en gång levde, trodde och dokumenterade sin värld.

Citering: Zeng, S., Bai, J., Shi, J. et al. Human–computer collaborative approach to the decipherment of racle bone inscriptions with generative adversarial networks. npj Herit. Sci. 14, 232 (2026). https://doi.org/10.1038/s40494-026-02509-4

Nyckelord: orakelbenskrift, forn skrift, kulturellt arv AI, människa–AI-samarbete, kinesisk teckens utveckling