Clear Sky Science · fr

Cadre progressif en trois étapes pour l’inpainting des manuscrits Dongba anciens

· Retour à l’index

Pourquoi sauver l’écriture figurative ancienne importe

Pour le peuple Naxi du sud‑ouest de la Chine, les livres Dongba ouvrent une porte sur mille ans d’histoires, de rituels et de vie quotidienne. Ces ouvrages sont rédigés dans une écriture rare, proche de l’image, qui mêle dessins et signes. Le temps, l’humidité et les manipulations ont endommagé de nombreuses pages, laissant des trous et des traits manquants qui rendent les symboles difficiles à lire ou même à reconnaître. Cette étude présente une nouvelle méthode numérique pour « combler les lacunes » de ces textes fragiles, visant à restaurer à la fois l’apparence graphique et le sens, et offrant un outil puissant pour la préservation culturelle.

Des pages abîmées à la restauration numérique

Les conservateurs ont longtemps tenté de réparer physiquement les manuscrits endommagés, mais la restauration numérique propose aujourd’hui une voie complémentaire : plutôt que de toucher l’original, l’ordinateur peut reconstruire les parties manquantes sur une image numérisée. Pour le texte imprimé courant, les algorithmes modernes devinent déjà correctement les lettres perdues à partir des formes et des motifs environnants. Les livres Dongba posent un défi plus difficile. Chaque symbole est un petit dessin dont les traits portent à la fois un style visuel et un sens. Si le logiciel se contente d’achever les lignes pour obtenir une apparence lisse, il risque de transformer involontairement le symbole en quelque chose qui n’a jamais existé, déformant ainsi le document culturel. Les auteurs soutiennent qu’une restauration sérieuse doit respecter à la fois l’aspect artistique et les règles strictes du système d’écriture.

Figure 1
Figure 1.

Un parcours en trois étapes, de l’esquisse au sens

L’équipe de recherche propose un cadre progressif en trois étapes, appelé TsP, spécifiquement conçu pour des pages Dongba fortement endommagées. Dans la première étape, le système se concentre uniquement sur les contours. Il prend l’image endommagée, détecte où les traits se trouvaient, et utilise un hybride de deux techniques puissantes — des réseaux convolutionnels, efficaces pour les détails locaux, et des Transformers, bons pour la structure globale — pour reconstruire approximativement les bords manquants. Le résultat est une carte de contours approximative, comme un croquis suggérant la forme générale du caractère même là où des parties sont absentes.

Laisser un dictionnaire numérique guider la réparation

Dans la deuxième étape, le système intègre des connaissances sur le Dongba lui‑même. Les chercheurs ont constitué un dictionnaire numérique des symboles Dongba courants, incluant de nombreux styles manuscrits pour chacun d’eux. L’algorithme compare le contour réparé de la première étape à toutes les entrées de ce dictionnaire et trouve le caractère complet le plus similaire. Il ne s’appuie pas sur des étiquettes textuelles, mais mesure la proximité des formes selon des critères statistiques. Le symbole choisi sert de « préalable de contenu » — la meilleure estimation de ce que le caractère manquant est supposé être, fournissant à la fois des indices sémantiques et des détails fins de traits qu’une méthode purement visuelle manquerait.

Polir l’image finale

Dans la troisième et dernière étape, TsP combine deux flux d’information : le contour structurel issu de la première étape et le caractère complet issu du dictionnaire. Un réseau neuronal à double branche spécialement conçu extrait des caractéristiques depuis les deux sources, une branche se focalisant sur la disposition des traits et l’autre sur les motifs de contenu plus riches. Ces caractéristiques guident ensuite un module de restauration qui opère non seulement dans l’espace image mais aussi dans le domaine fréquentiel, où des réglages de la régularité globale et du rythme des traits sont plus efficaces. Ce passage final supprime les artefacts, reconstitue les parties manquantes des traits et lisse les transitions entre les régions anciennes et nouvellement générées pour que le caractère réparé s’intègre naturellement à la page originale.

Figure 2
Figure 2.

Quelle est l’efficacité du procédé ?

Pour évaluer leur approche, les auteurs ont utilisé DB1404, le seul grand jeu de données public de caractères Dongba, qui comprend des milliers de symboles capturés dans de nombreux styles. Ils ont créé des « dommages » numériques de gravité variable, masquant depuis une petite portion de chaque image jusqu’à la moitié, en employant des trous et des rayures irréguliers imitant la détérioration réelle. TsP a été comparé aux méthodes de réparation d’image de pointe, incluant outils classiques, systèmes modernes basés sur les Transformers et modèles de diffusion. À tous les niveaux de dégâts, TsP a produit des images à la fois visuellement plus convaincantes et structurellement plus proches des caractères originaux, surtout lorsque de larges portions manquaient — exactement la situation la plus critique pour des manuscrits rares et fragiles.

Ce que cela signifie pour les écritures anciennes

Concrètement, ce travail montre que les ordinateurs peuvent apprendre non seulement à estomper les fissures d’une image, mais aussi à respecter les règles et le sens d’un système d’écriture ancien lors de l’opération. En devinant d’abord le squelette d’un caractère endommagé, puis en l’associant à un symbole connu, et enfin en utilisant les deux comme guides pour un inpainting soigné, TsP préserve mieux la forme originelle et le sens de l’écriture Dongba. Au‑delà d’un progrès technique, cette approche pourrait aider bibliothécaires, historiens et communautés locales à récupérer le contenu de manuscrits qui autrement resteraient illisibles, et fournit un modèle pour restaurer d’autres écritures en danger à travers le monde.

Citation: Bi, X., Shi, Q. & Chen, Z. Three-stage progressive framework for Dongba ancient texts inpainting. npj Herit. Sci. 14, 240 (2026). https://doi.org/10.1038/s40494-026-02524-5

Mots-clés: manuscrits Dongba, restauration d’écritures anciennes, inpainting d’images, numérisation du patrimoine culturel, apprentissage profond