Clear Sky Science · fr

Identification du scribe des céramiques poétiques du four de Changsha (dynastie Tang) via un modèle d’attention globale multi-échelle à double voie

· Retour à l’index

Poèmes sur l’argile, récits de personnes

Sur la surface de petits pots et d’oreillers en porcelaine de la dynastie Tang, de graciles lignes de poésie furent tracées sur une glaçure encore humide il y a plus d’un millénaire. Ces brefs vers sont aujourd’hui précieux non seulement pour leur beauté, mais aussi pour ce qu’ils peuvent révéler sur les personnes qui les ont écrits. Jusqu’à présent, relier une inscription donnée à un scribe particulier reposait sur le regard entraîné de quelques experts. Cette étude montre comment l’intelligence artificielle moderne peut aider à lire la main humaine derrière ces artefacts fragiles, ouvrant une nouvelle fenêtre sur la vie quotidienne, le travail et le commerce dans la Chine médiévale ancienne.

Figure 1
Figure 1.

Pourquoi ces pots comptent

Le four de Changsha, actif pendant l’apogée de la dynastie Tang, produisait des céramiques colorées décorées de peintures, de calligraphie et de poésie. Ces objets ont voyagé largement le long des premières routes commerciales et sont devenus des vecteurs de littérature et de goût, en plus d’être des récipients pratiques. Leurs inscriptions conservent non seulement le texte mais aussi l’énergie des coups de pinceau et les choix des écrivains individuels. Cependant, la plupart des pièces survivantes sont dispersées dans des musées et des collections privées, et les images de haute qualité sont rares. Aucun jeu de données d’images public et standardisé de ces inscriptions n’existait, rendant difficile la comparaison des pièces, le test de méthodes numériques, ou la formulation de questions de base telles que : un même potier-scribe a-t-il écrit les poèmes sur plusieurs vases différents ?

Constitution d’une bibliothèque numérique de l’écriture Tang

Pour répondre à cela, les auteurs ont d’abord assemblé une nouvelle collection d’images à partir de catalogues publiés des céramiques de Changsha. À partir de 135 artefacts individuels — principalement des cruches, des plats et des oreillers portant des poèmes ou de brefs textes — ils ont extrait avec soin 1 865 images de caractères isolés. Comme les inscriptions se trouvent sur des surfaces céramiques courbes, les caractères près des bords apparaissent déformés en photographie. L’équipe a utilisé un processus spécialisé de segmentation d’image et d’aplatissement de surface pour corriger cette courbure, puis a nettoyé la saleté et les fissures, converti les images en niveaux de gris, redimensionné, réduit le bruit et légèrement retourné certaines images pour augmenter la variété. Le résultat est le premier jeu de données dédié à l’écriture poétique du four de Changsha, une ressource qui peut soutenir la reconnaissance de script, l’analyse de style et de nombreuses autres études à l’avenir.

Apprendre à un réseau de neurones à voir le style

Avec ce jeu de données, les chercheurs ont conçu un système de vision par ordinateur dont la tâche est de décider si deux images de caractères ont probablement été écrites par la même personne. Le modèle reçoit une paire de caractères via deux voies parallèles qui partagent les mêmes étapes de traitement. Après un filtrage de base, les deux images passent par un réseau neuronal profond (ResNet-34) qui extrait des motifs dans l’épaisseur des traits, les courbes, l’espacement et d’autres caractéristiques subtiles. Au cœur du système se trouve un nouveau module d’attention globale multi-échelle. Plutôt que de n’examiner qu’un niveau unique de détail, ce module analyse les caractères à plusieurs échelles simultanément — de la mise en page globale aux ondulations fines des traits — et apprend comment des parties éloignées d’un même trait se relient entre elles. En combinant ces vues, le modèle construit une riche « empreinte » interne du style de chaque scribe puis compare les deux empreintes pour produire un score de similarité entre 0 et 1.

Figure 2
Figure 2.

Épreuve du système

L’équipe a comparé plusieurs architectures de réseaux neuronaux populaires et mécanismes d’attention et a constaté que leur réseau à double voie avec le nouveau module d’attention offrait la meilleure performance. Il a atteint une précision de reconnaissance d’environ 97,9 %, surpassant nettement les anciens modèles d’attention à échelle unique. Pour comprendre ce que l’algorithme avait appris, les auteurs ont généré des cartes de chaleur montrant où le réseau « regarde » le plus attentivement. Celles-ci mettent en évidence les tournants de traits, les traits inclinés vers la gauche et d’autres zones où la pression et le rythme du pinceau diffèrent d’une personne à l’autre — tout comme ce qu’un connaisseur humain examinerait. Les chercheurs ont ensuite réalisé de vastes tests par lots au sein d’un même artefact et entre différents artefacts. Dans un même pot, le système jugeait de façon cohérente tous les caractères comme très similaires, soutenant l’idée que le poème de chaque vase avait été écrit par un seul scribe plutôt que par plusieurs.

Nouveaux indices sur les artisans anciens

Le résultat le plus saisissant est apparu lorsque le modèle a comparé des pièces provenant de collections différentes. Deux oreillers en céramique inscrits de poèmes d’amour en sept caractères ont montré une très forte similarité stylistique, bien qu’ils se trouvent aujourd’hui dans des institutions distinctes. Les archives archéologiques situent les deux oreillers au même site de four, et leurs formes, motifs décoratifs et thèmes correspondent étroitement. Le verdict de l’algorithme — une probabilité de 85,8 % que la même main ait écrit les deux inscriptions — soutient la conclusion qu’ils ont été réalisés par un unique scribe. En revanche, trois cruches à vin similaires portant des vers d’avertissement apparentés au sujet du regret ont présenté de faibles scores de similarité, suggérant trois calligraphes différents recopiant une formule textuelle commune. Ensemble, ces résultats montrent comment un « regard » par IA peut aider les historiens à retracer l’organisation des ateliers, la division du travail et les pratiques commerciales.

Ce que cela signifie pour le passé et l’avenir

En combinant une imagerie numérique soignée avec un réseau neuronal sophistiqué, cette étude transforme des traces d’encre fragiles sur la poterie en preuves quantitatives sur qui a écrit quoi. Pour le lecteur général, la leçon principale est que la vision par ordinateur peut désormais distinguer des mains individuelles dans la calligraphie ancienne presque aussi fiablement qu’un expert humain, mais beaucoup plus rapidement et sur beaucoup plus d’objets. Cela permet de relier des pièces dispersées à travers le monde, de cartographier les carrières d’artisans oubliés depuis longtemps et de mieux comprendre comment production de masse et expression personnelle coexistaient à l’époque Tang. Bien que la méthode ne soit pas parfaite et dépende de données limitées et parfois endommagées, elle offre un outil puissant pour les musées et les chercheurs — et un modèle pour l’application de l’IA à de nombreux autres types d’écritures historiques.

Citation: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5

Mots-clés: écriture ancienne, céramiques de la dynastie Tang, identification du scribe, apprentissage profond, patrimoine numérique