Clear Sky Science · it

Elaborazione delle iscrizioni su ossa oracolari: una rassegna completa

· Torna all'indice

Ossa antiche, domande moderne

Più di 3.000 anni fa, i divinatori in Cina incidevano domande per i loro sovrani su gusci di tartaruga e ossa di bue, poi le crepavano con il calore per leggere gli auspici. Queste iscrizioni oracolari rappresentano la più antica scrittura cinese conosciuta e offrono una rara finestra sulla politica, la religione e la vita quotidiana dell’età del Bronzo. Oggi, però, le ossa sono gravemente frammentate, la scrittura è difficile da leggere e molti caratteri restano indecifrati. Questo articolo spiega come le nuove ondate di intelligenza artificiale stiano trasformando il modo in cui gli studiosi ripuliscono, ricostruiscono, leggono e interpretano questi fragili residui del passato, e quali sfide rimangono ancora da affrontare.

Figure 1
Figure 1.

Dalla mano e dall’occhio al silicio e al codice

Per buona parte del secolo scorso, le ossa oracolari potevano essere studiate solo da un ristretto circolo di esperti che esaminavano con cura sfregiature d’inchiostro, tracciati e fotografie. Compilavano enormi cataloghi stampati, proponevano letture di singoli caratteri e discutevano su come datare e raggruppare le iscrizioni. Questo lavoro ha gettato le basi del campo, ma era lento, difficile da riprodurre e fortemente dipendente dalla memoria e dal giudizio personale di ciascuno studioso. Con l’avvento dei computer, i ricercatori hanno iniziato a digitalizzare le sfregiature e ad applicare semplici tecniche di elaborazione delle immagini come il miglioramento del contrasto e il rilevamento dei bordi. Questi primi strumenti hanno reso le ossa più facili da vedere e condividere, ma trattavano i caratteri come mere forme, non come scrittura carica di significato.

Il deep learning entra negli archivi

L’ascesa del deep learning ha cambiato lo scenario. Reti neurali convoluzionali e transformer, inizialmente perfezionati su fotografie di uso quotidiano, sono stati riaddestrati per individuare i caratteri su sfregiature rumorose, classificarli e perfino aiutare a ricongiungere frammenti rotti appartenuti alla stessa ossa. Per alimentare questi modelli affamati di dati, i team hanno compilato dozzine di dataset specializzati: alcuni mirano a identificare ogni carattere in una sfregiatura, altri a classificare glifi ritagliati, collegare radicali e componenti, o accoppiare forme antiche con scritture successive. Tuttavia i dati riflettono la realtà storica: pochi caratteri comuni appaiono migliaia di volte, mentre molti segni rari o indecifrati compaiono una sola volta. I ricercatori rispondono con astute tecniche di data augmentation, modelli generativi che sintetizzano nuovi esempi e schemi di addestramento progettati per riconoscere caratteri a partire da poche—o nessuna—occorrenze note.

Insegnare alle macchine a collegare visione e significato

Nell’ultima fase, grandi modelli multimodali che combinano visione e linguaggio vengono adattati alle ossa oracolari. Invece di limitarsi a individuare dove sono i caratteri, questi sistemi cercano di collegare l’aspetto di un glifo con il suo possibile significato, proprio come farebbe un paleografo umano. Nuovi benchmark testano se tali modelli possono riconoscere i caratteri, ricongiungere frammenti, recuperare iscrizioni simili e suggerire letture plausibili. Alcuni framework tentano di mappare i segni antichi direttamente sui caratteri cinesi moderni, tracciando l’evoluzione visiva nel corso dei secoli; altri collegano segni pittografici a immagini di oggetti del mondo reale; altri ancora provano a fornire spiegazioni testuali complete di ciò che potrebbe dire una linea di divinazione. Sistemi in stile agent orchestrano più strumenti e banche dati, aiutando gli utenti a cercare in immagini, trascrizioni e note accademiche in un unico flusso di lavoro.

Figure 2
Figure 2.

Dati, valutazione e il rompicapo di una storia frammentata

Nonostante i rapidi progressi, la rassegna mette in luce ostacoli ostinati. Molte delle migliori collezioni di immagini e scansioni 3D sono conservate in musei o archivi privati e non sono liberamente accessibili, rendendo difficile confrontare i metodi in modo equo o addestrare modelli davvero generali. Anche i dataset pubblici spesso presentano distribuzioni di classe a lunga coda, etichette incoerenti o scarsa qualità delle immagini. Le metriche standard di performance ereditate dal rilevamento di oggetti o dal riconoscimento della scrittura possono non cogliere ciò che conta davvero per gli storici—per esempio, se un modello confonde due varianti accettate dello stesso carattere, o se la lettura proposta rispetta la costruzione del segno a partire da parti più piccole. La valutazione umana è ugualmente frammentata: studi diversi coinvolgono tipi diversi di esperti, pongono domande differenti e raramente riportano dettagli sufficienti perché altri possano replicare i test.

Dove la scrittura antica incontra l’IA del futuro

Per progredire, gli autori sostengono la necessità di dataset più ricchi e meglio documentati; metodi di valutazione che premiano la comprensione strutturale e semantica, non solo le corrispondenze a livello di pixel; e una collaborazione più stretta tra tecnologi e specialisti della scrittura cinese antica. Immaginano generatori testo‑immagine capaci di produrre caratteri nello stile delle ossa a partire da descrizioni, modelli di base addestrati specificamente su scritture antiche, sistemi multi‑agente che dibattono e raffinano letture concorrenti e persino ricostruzioni 3D che ripristinino la forma originale delle ossa rotte. In termini semplici, la conclusione dell’articolo è che l’IA non "risolverà" da sola le ossa oracolari, ma può diventare un partner potente—amplificando l’intuizione degli esperti, rendendo archivi vasti ricercabili e aprendo le voci dell’età del Bronzo a un pubblico molto più ampio.

Citazione: Chen, Z., Hua, W., Li, J. et al. Oracle bone inscriptions information processing: a comprehensive survey. npj Herit. Sci. 14, 220 (2026). https://doi.org/10.1038/s40494-026-02511-w

Parole chiave: iscrizioni su ossa oracolari, scrittura cinese antica, umanesimo digitale, intelligenza artificiale, modelli multimodali