Clear Sky Science · it
Framework progressivo in tre fasi per l’inpainting dei testi antichi Dongba
Perché è importante salvare la scrittura figurativa antica
Per il popolo Naxi del sud-ovest della Cina, i libri Dongba sono una porta su mille anni di storie, rituali e vita quotidiana. Questi libri sono scritti in una rara scrittura simile a immagini che fonde pittogrammi e parole. Il tempo, l’umidità e la manipolazione hanno danneggiato molte pagine, lasciando buchi e tratti mancanti che rendono i simboli difficili da leggere o perfino da riconoscere. Questo studio presenta un nuovo metodo digitale per “colmare le lacune” di questi testi fragili, con l’obiettivo di ripristinare sia l’aspetto visivo della scrittura sia il suo significato, offrendo uno strumento potente per la conservazione culturale.
Dalle pagine rotte al restauro digitale
I restauratori hanno a lungo provato a riparare fisicamente i manoscritti danneggiati, ma oggi il restauro digitale offre una strada alternativa: invece di toccare l’originale, i computer possono ricostruire le parti mancanti su un’immagine scansionata. Per i testi a stampa comuni, gli algoritmi moderni già indovinano abbastanza bene le lettere perdute a partire dalle forme e dai pattern circostanti. I libri Dongba presentano una sfida più difficile. Ogni simbolo è un piccolo disegno i cui tratti contengono sia stile visivo sia significato. Se il software si limita a completare i segni per renderli esteticamente coerenti, rischia di trasformare il simbolo in qualcosa che non è mai esistito, falsando il registro culturale. Gli autori sostengono che un restauro serio deve rispettare sia l’aspetto artistico sia le regole del sistema di scrittura.

Un percorso in tre fasi dall’involucro al significato
Il team di ricerca propone un framework progressivo in tre fasi, chiamato TsP, progettato specificamente per pagine Dongba fortemente danneggiate. Nella prima fase, il sistema si concentra solo sui contorni. Prende l’immagine danneggiata, rileva dove una volta c’erano i tratti e utilizza un ibrido di due tecniche potenti—reti convoluzionali, efficaci nei dettagli locali, e Transformer, efficaci nella struttura globale—per ricostruire grossolanamente i bordi mancanti. Il risultato è una mappa di contorno approssimativa, come uno schizzo che suggerisce la forma complessiva del carattere anche dove parti sono assenti.
Lasciare che un dizionario digitale guidi la riparazione
Nella seconda fase, il sistema integra conoscenza specifica dei Dongba. I ricercatori hanno costruito un dizionario digitale di simboli Dongba usati comunemente, includendo molte varianti calligrafiche per ciascuno. L’algoritmo confronta il contorno riparato della fase uno con tutte le voci di questo dizionario e trova il carattere completo più simile. Non lo fa leggendo etichette testuali, ma misurando quanto le forme corrispondono in senso statistico. Il simbolo scelto funge da “prior di contenuto” — la migliore ipotesi di quale dovesse essere il carattere mancante, fornendo sia indizi semantici sia dettagli fini dei tratti che un approccio puramente visivo potrebbe non cogliere.
Rifinire l’immagine finale
Nella terza e ultima fase, TsP combina due flussi d’informazione: il contorno strutturale della prima fase e il carattere completo proveniente dal dizionario. Una rete neurale a doppio ramo appositamente progettata estrae caratteristiche da entrambe le fonti, un ramo concentrato sulla disposizione dei tratti e l’altro sui pattern di contenuto più ricchi. Queste caratteristiche guidano poi un modulo di restauro che opera non solo nello spazio dell’immagine ma anche nel dominio delle frequenze, dove è possibile regolare più efficacemente pattern come la morbidezza generale e il ritmo dei tratti. Questa passata finale pulisce artefatti, aggiunge parti mancanti dei tratti e smussa le transizioni tra le regioni originali e quelle generate, in modo che il carattere riparato si integri naturalmente nella pagina originale.

Quanto funziona bene?
Per testare il loro approccio, gli autori hanno usato DB1404, l’unico grande dataset pubblico di caratteri Dongba, che include migliaia di simboli catturati in molti stili. Hanno creato “danni” digitali di gravità variabile, mascherando da una piccola porzione di ciascuna immagine fino alla metà, usando fori irregolari e graffi che imitano il deterioramento reale. TsP è stato confrontato con metodi di riparazione delle immagini all’avanguardia, inclusi strumenti classici, sistemi moderni basati su Transformer e modelli di diffusione. A tutti i livelli di danneggiamento, TsP ha prodotto immagini visivamente più convincenti e strutturalmente più vicine ai caratteri originali, soprattutto quando mancavano ampie porzioni—proprio la situazione più critica per manoscritti rari e fragili.
Cosa significa per le scritture antiche
In termini semplici, questo lavoro dimostra che i computer possono imparare non solo a lisciare le crepe in un’immagine, ma a rispettare le regole e i significati di un sistema di scrittura antico mentre lo fanno. Stimando prima lo scheletro di un carattere danneggiato, poi abbinandolo a un simbolo noto e infine usando entrambi come guida per un inpainting attento, TsP preserva meglio la forma originale e il senso della scrittura Dongba. Oltre al risultato tecnico, questo approccio potrebbe aiutare bibliotecari, storici e comunità locali a recuperare i contenuti di manoscritti altrimenti illeggibili e fornisce un modello per il restauro di altre scritture in pericolo nel mondo.
Citazione: Bi, X., Shi, Q. & Chen, Z. Three-stage progressive framework for Dongba ancient texts inpainting. npj Herit. Sci. 14, 240 (2026). https://doi.org/10.1038/s40494-026-02524-5
Parole chiave: Manoscritti Dongba, restauro di scrittura antica, inpainting di immagini, digitalizzazione del patrimonio culturale, deep learning