Clear Sky Science · fr

Restauration des caractères des tablettes de Liye (dynastie Qin) par réseau antagoniste génératif avec contrainte efficace sur les composantes connexes

· Retour à l’index

Des mots anciens ramenés à la vie

Bien avant l’invention du papier, les fonctionnaires chinois écrivaient sur de fines lattes de bambou et de bois. Des milliers de ces documents fragiles, connus sous le nom de tablettes de Liye (période Qin), ont été retirés d’un puits abandonné après être restés plus de deux millénaires sous terre. Ils conservent des ordres quotidiens, des comptes et des rapports du premier empire chinois unifié. Mais l’eau, la boue et les microbes ont estompé ou effacé une grande partie de l’encre, rendant la lecture des tablettes à la main extrêmement lente. Cette étude montre comment un système d’intelligence artificielle moderne peut « nettoyer » numériquement ces caractères endommagés et aider les historiens à faire réapparaître des voix du passé.

Pourquoi ces archives enterrées comptent

Les tablettes de Liye ne sont pas des décrets royaux ni de grands monuments ; ce sont les papiers d’un gouvernement opérationnel. Plus de 30 000 tablettes documentent les impôts, le travail et l’administration courante dans un district à la frontière de l’empire Qin. À la différence d’autres tablettes trouvées dans des tombes sèches, celles de Liye reposaient dans des sédiments humides au fond d’un puits. Beaucoup sont déformées, fissurées et tachées ; les traits du pinceau sont brouillés ou partiellement effacés. Déchiffrer un lot peut prendre des années aux spécialistes, et le nombre croissant de découvertes dépasse ce que l’œil humain peut traiter seul. Automatiser une partie du processus de restauration pourrait accélérer considérablement la recherche tout en préservant les formes subtiles qui rendent chaque caractère lisible.

Figure 1
Figure 1.

Apprendre à l’ordinateur à voir au travers des dégâts

Les auteurs abordent la restauration comme une forme de traduction d’images : l’ordinateur reçoit une petite image bruitée d’un caractère et doit produire ce que ce caractère aurait l’air d’être s’il était propre et net. Pour cela, ils s’appuient sur un type d’IA appelé réseau antagoniste génératif, ou GAN. Un réseau (le « générateur ») tente de transformer une image endommagée en une image claire, tandis qu’un autre (le « discriminateur ») juge si le résultat ressemble à un caractère authentique et bien tracé. Par ce jeu de va-et-vient, le générateur apprend peu à peu à produire des restaurations plus convaincantes qui trompent le critique.

Une attention plus fine aux petits traits de pinceau

Les outils d’imagerie standard manquent souvent les détails les plus fins de l’encre sur le bambou, surtout lorsque l’arrière-plan est tacheté et que l’encre est pâle. L’équipe améliore le cœur du GAN en utilisant une architecture en U connue sous le nom de U-Net, qui équilibre le contexte global et le détail au niveau du pixel. Ils remplacent les composants habituels de ce réseau par des blocs locaux résiduels denses spécialement conçus. Ces blocs incitent le système à réutiliser des motifs utiles tout en évitant le sur-lissage qui peut faire fusionner des traits voisins. Une section « goulot d’étranglement » renforcée au milieu du réseau affine davantage les caractéristiques essentielles, aidant le modèle à distinguer les vrais traits du bruit même lorsque l’original est fortement dégradé.

Conserver le squelette de chaque caractère

Une innovation clé est ce que les auteurs appellent la contrainte de Domaine Connecté Efficace. Plutôt que d’évaluer chaque pixel indépendamment, cette règle examine les principales régions d’encre d’un caractère : leur taille et la position de leurs centres. Le modèle compare ces « îlots » d’encre grossiers dans sa sortie à ceux d’images de référence soigneusement restaurées, en accordant une attention particulière seulement aux quelques plus grands qui forment le squelette central du caractère. Si un trait majeur manque, est fusionné avec un autre ou déplacé, le système est pénalisé et forcé à s’ajuster. Cette vérification géométrique simple se révèle remarquablement stable même lorsque les traits sont brisés, les bords irréguliers ou l’encre diffusée dans le fond.

Figure 2
Figure 2.

Quelle est l’efficacité des réparations numériques

Faute de données adaptées, l’équipe a créé son propre jeu d’exemples appariés de 600 images de caractères tirées des tablettes de Liye, chacune associée à une restauration réalisée avec soin par des experts. Sur ce référentiel, leur méthode surpasse plusieurs approches de pointe, y compris d’autres GAN, un modèle basé sur Transformer et un modèle de diffusion, selon trois mesures standard de qualité d’image. Les comparaisons visuelles côte à côte montrent moins de traits cassés, une séparation plus nette entre des traits de pinceau proches et moins de parasites d’arrière-plan. Des professeurs de calligraphie qui ont évalué les résultats en aveugle ont attribué de bonnes notes pour la continuité des traits, la justesse structurelle et la lisibilité générale, et des tests séparés suggèrent que le modèle ne se contente pas de mémoriser les données d’entraînement.

Ramener l’écriture enfouie au premier plan

Pour le grand public, le message est clair : en combinant la connaissance experte des écritures anciennes avec des architectures d’IA adaptées, il est désormais possible de restituer une écriture lisible à partir de tablettes en bambou qui semblaient trop endommagées pour être utilisées. Le modèle préserve non seulement la présence d’un caractère, mais aussi la manière dont ses traits se situent dans l’espace, rendant le résultat utile pour les historiens et les linguistes. Même si l’approche dépend encore de jeux de données limités et n’a pas encore été adaptée à d’autres supports comme la soie ou la pierre, elle ouvre la voie à un avenir où de nombreux textes fragiles et difficilement lisibles pourront être restaurés numériquement et étudiés à grande échelle, offrant de nouvelles perspectives sur la vie quotidienne dans les premiers empires.

Citation: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6

Mots-clés: restauration de tablettes en bambou, manuscrits chinois anciens, réseaux antagonistes génératifs, préservation du patrimoine numérique, restitution de caractères manuscrits