Clear Sky Science · fr
Vérification du scribe des bambous de Tsinghua à l’aide de réseaux siamois
Des livres anciens rencontrent du code moderne
Bien avant le papier et les écrans, les penseurs chinois écrivaient sur de fines lames de bambou. Aujourd’hui, ces manuscrits fragiles sont des mines d’or pour les historiens, mais une question apparemment simple est étonnamment difficile à trancher : quelles lames ont été écrites de la même main ? Cette étude mêle archéologie et intelligence artificielle pour construire un assistant numérique pouvant aider les chercheurs à déterminer qui a écrit quoi sur des milliers de lames de bambou vieilles de 2 300 ans issues de la célèbre collection de l’université Tsinghua.

Pourquoi l’écriture à la main compte
Les lames de bambou de Tsinghua datent de la période des Royaumes combattants, juste avant le premier empire chinois. Elles conservent des versions anciennes de textes politiques, historiques et philosophiques qui ont influencé la tradition ultérieure ou qui en ont été perdues. Pour comprendre véritablement ces écrits, les chercheurs doivent savoir comment les lames se regroupent, quelles parties appartiennent au même manuscrit et combien de scribes y ont travaillé. Traditionnellement, les experts répondent à ces questions à l’œil nu, en évaluant la fluidité des traits, la pression et la mise en page. Ce métier est lent, subjectif et difficile à étendre à mesure que de nouvelles découvertes apparaissent.
Transformer les traits en données
Les auteurs ont entrepris d’apprendre à un ordinateur à comparer des caractères manuscrits individuels extraits de photos haute résolution des lames. Ils ont d’abord constitué une grande collection d’images : 15 745 caractères isolés provenant de 11 scribes identifiés auparavant, sur la base d’études paléographiques consensuelles. À l’aide de logiciels professionnels de traitement d’image, ils ont supprimé le bruit d’arrière‑plan, isolé chaque caractère dans un rectangle et filtré les signes endommagés ou chevauchants. Ils ont ensuite augmenté les classes les plus petites — les scribes disposant de peu de caractères survivants — par des astuces simples comme le retournement, la rotation, le recadrage et l’ajout de bruit, afin que l’algorithme ne soit pas biaisé en faveur des styles les plus fréquents.
Un réseau jumeau qui cherche la ressemblance
Plutôt que de demander à l’ordinateur d’identifier l’auteur de chaque caractère, l’équipe a posé une question plus simple mais plus flexible : ces deux images proviennent‑elles de la même main ? Pour cela, ils ont utilisé un réseau neuronal « siamois », une paire de branches de traitement d’image identiques partageant les mêmes paramètres. Chaque branche convertit une image de caractère en une empreinte numérique compacte. Le système mesure ensuite la distance entre les deux empreintes : une petite distance suggère le même scribe, une distance plus grande suggère des scribes différents. Au cœur de chaque branche se trouve un modèle léger amélioré appelé MobileNet_V3+, enrichi d’un mécanisme d’attention qui apprend à mettre en évidence les caractéristiques visuelles les plus révélatrices — courbes subtiles, épaisseur des traits ou façons préférées de former certaines parties des caractères — tout en atténuant les détails moins utiles.

Quelle est la performance du système
Sur l’ensemble de données de Tsinghua, la meilleure version du modèle a correctement évalué si des paires de caractères provenaient du même scribe dans environ 90 % des cas, avec un score très élevé sur un test standard de discrimination binaire. Il a surpassé plusieurs systèmes de reconnaissance d’image plus lourds, tels que ResNet, VGG et les Vision Transformers, qui avaient tendance soit à surapprendre les données limitées, soit à manquer les indices stylistiques fins nécessaires à cette tâche. Des inspections visuelles des « cartes d’attention » du réseau ont montré qu’au fil de l’entraînement, le modèle a cessé de se focaliser sur la silhouette globale pour se concentrer sur des segments clés des traits — à la manière d’un expert humain.
Aider à trancher de vrais débats savants
Pour tester l’utilité de l’outil en dehors du laboratoire, les auteurs l’ont appliqué à plusieurs manuscrits sur bambou dont l’attribution a été débattue pendant des années. Pour trois textes (« Ji Gong », « Hou Fu » et « She Ming »), des chercheurs antérieurs en étaient venus à penser qu’ils avaient été écrits par le même scribe du groupe plus large dit « Yin Zhi ». Le modèle a fortement soutenu cette hypothèse, trouvant une très grande similarité dans toutes les paires. Pour une autre paire de manuscrits, « Zhi Zheng » et « Zhi Bang », les chercheurs se disputaient pour savoir s’il y avait un ou plusieurs scribes. Les comparaisons du réseau suggèrent que les pages 1–42 de « Zhi Zheng » forment un style de scribe distinct, tandis que la page 43 de « Zhi Zheng » correspond étroitement à « Zhi Bang » mais pas aux pages antérieures — preuve de l’intervention de deux scribes distincts qui n’avaient pas été classés dans une catégorie connue auparavant.
Ce que cela signifie pour le passé et l’avenir
Concrètement, ce travail montre qu’un système d’IA compact peut dire de manière fiable quand deux minuscules fragments d’écriture ancienne proviennent probablement de la même personne, même lorsqu’il ne voit qu’un seul caractère. Il ne remplacera pas le jugement des spécialistes, mais il peut rapidement parcourir de grandes collections, signaler des correspondances probables et fournir un appui quantitatif en faveur ou contre des regroupements particuliers de lames. Au‑delà du trésor de Tsinghua, la même approche pourrait être adaptée à d’autres documents fragiles, des os d’oracle aux rouleaux de la Route de la Soie, aidant historiens et linguistes à reconstituer la circulation des idées à travers le temps et l’espace.
Citation: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8
Mots-clés: lames de bambou, analyse de l’écriture, apprentissage profond, patrimoine culturel, réseau siamois