Clear Sky Science · it

Verifica dello scriba sui bambù di Tsinghua usando reti Siamese

· Torna all'indice

Libri antichi incontrano codice moderno

Molto prima della carta e degli schermi, i pensatori cinesi scrivevano su sottili strisce di bambù. Oggi questi fragili manoscritti sono vere miniere per gli storici, ma una domanda di base è sorprendentemente difficile da rispondere: quali strisce sono state scritte dalla stessa mano? Questo studio fonde archeologia e intelligenza artificiale per costruire un assistente digitale che possa aiutare gli studiosi a capire chi ha scritto cosa su migliaia di strisce di bambù vecchie di 2.300 anni provenienti dalla famosa collezione dell’Università di Tsinghua.

Figure 1
Figure 1.

Perché la grafia è importante

Le strisce di bambù di Tsinghua risalgono al periodo degli Stati Combattenti, appena prima del primo impero cinese. Conservano versioni antiche di testi su politica, storia e filosofia che hanno influenzato la tradizione successiva o che in seguito sono andati perduti. Per comprendere davvero questi scritti, i ricercatori devono sapere come sono raggruppate le strisce, quali parti appartengono allo stesso manoscritto e quanti scribi vi hanno lavorato. Tradizionalmente, gli esperti rispondono a queste domande ad occhio, valutando la scorrevolezza del tratto, la pressione e l’impaginazione. Questo mestiere è lento, soggettivo e difficile da scalare con l’emergere di nuovi reperti.

Trasformare i tratti in dati

Gli autori hanno cercato di insegnare a un computer a confrontare singoli caratteri scritti a mano ritagliati da foto ad alta risoluzione delle strisce. Hanno prima costruito un’ampia raccolta di immagini: 15.745 caratteri singoli provenienti da 11 scribi identificati in studi paleografici di consenso. Utilizzando software professionale di elaborazione delle immagini, hanno rimosso il rumore di fondo, isolato ogni carattere in un rettangolo e filtrato segni danneggiati o sovrapposti. Hanno poi ampliato le classi più piccole — scribi con pochi caratteri sopravvissuti — con semplici espedienti come ribaltamenti, rotazioni, ritagli e aggiunta di rumore, in modo che l’algoritmo non risultasse sbilanciato verso stili più comuni.

Una rete gemella che cerca somiglianze

Invece di chiedere al computer di nominare l’autore di ciascun carattere, il team ha posto una domanda più semplice ma più flessibile: queste due immagini vengono dalla stessa mano? Per farlo hanno usato una rete neurale “Siamese”, una coppia di rami identici di elaborazione delle immagini che condividono i parametri. Ciascun ramo converte l’immagine di un carattere in un’impronta numerica compatta. Il sistema misura quindi la distanza tra le due impronte: distanze ridotte suggeriscono lo stesso scriba, distanze maggiori indicano scribi diversi. Al centro di ciascun ramo c’è un modello leggero potenziato chiamato MobileNet_V3+, migliorato con un meccanismo di attenzione che impara a enfatizzare le caratteristiche visive più significative — curve sottili, spessore del tratto o modi preferiti di formare parti dei caratteri — attenuando i dettagli meno utili.

Figure 2
Figure 2.

Quanto bene funziona il sistema

Sul dataset di Tsinghua, la versione migliore del modello ha valutato correttamente se coppie di caratteri provenivano dallo stesso scriba circa il 90% delle volte, con un punteggio molto alto in un test standard di discriminazione binaria. Ha superato diversi sistemi di riconoscimento immagini più pesanti, come ResNet, VGG e Vision Transformer, che tendevano o a sovradattarsi ai dati limitati o a perdere gli indizi stilistici sottili necessari per questo compito. Ispezioni visive delle “mappe di attenzione” della rete hanno mostrato che, con il progredire dell’addestramento, il modello ha smesso di guardare la silhouette complessiva per concentrarsi su segmenti chiave del tratto — proprio come farebbe un esperto umano.

Aiutare a risolvere controversie accademiche reali

Per verificare l’utilità dello strumento al di là del laboratorio, gli autori lo hanno applicato a diversi manoscritti su bambù la cui paternità è stata dibattuta per anni. Per tre testi (“Ji Gong”, “Hou Fu” e “She Ming”), studi precedenti hanno gradualmente ritenuto che fossero stati scritti dallo stesso scriba all’interno del più ampio gruppo “Yin Zhi”. Il modello ha fortemente supportato questa interpretazione, trovando altissima somiglianza in tutti gli abbinamenti. Per un’altra coppia di manoscritti, “Zhi Zheng” e “Zhi Bang”, i ricercatori avevano discusso se fosse coinvolto un singolo scriba o più scribi. I confronti della rete hanno suggerito che le pagine 1–42 di “Zhi Zheng” formavano uno stile scribale distinto, mentre la pagina 43 di “Zhi Zheng” corrispondeva strettamente a “Zhi Bang” ma non alle pagine precedenti — prova di due scribi separati non appartenenti a nessuna categoria precedentemente definita.

Cosa significa per passato e futuro

In termini semplici, questo lavoro dimostra che un sistema di IA compatto può indicare in modo affidabile quando due piccoli frammenti di scrittura antica provengono probabilmente dalla stessa persona, anche quando osserva solo singoli caratteri. Non sostituirà il giudizio degli esperti, ma può scansionare rapidamente grandi collezioni, segnalare corrispondenze probabili e fornire un supporto quantitativo a favore o contro particolari raggruppamenti di strisce. Oltre alla riserva di Tsinghua, lo stesso approccio potrebbe essere adattato ad altri documenti fragili, dalle ossa oracolari ai rotoli della Via della Seta, aiutando storici e linguisti a ricostruire come le idee si siano spostate nel tempo e nello spazio.

Citazione: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8

Parole chiave: strisce di bambù, analisi della grafia, deep learning, patrimonio culturale, rete Siamese