Clear Sky Science · es
Verificación de escribas en tablillas de bambú de Tsinghua usando redes siamesas
Libros antiguos encuentran código moderno
Mucho antes del papel y las pantallas, los pensadores chinos escribían en delgadas tiras de bambú. Hoy, estos frágiles manuscritos son minas de información para los historiadores, pero una pregunta básica resulta sorprendentemente difícil de responder: ¿qué tablillas fueron escritas por la misma mano? Este estudio combina arqueología e inteligencia artificial para crear un asistente digital que puede ayudar a los investigadores a averiguar quién escribió qué en miles de tablillas de bambú de 2.300 años de antigüedad de la célebre colección de la Universidad de Tsinghua.

Por qué importa la caligrafía
Las tablillas de bambú de Tsinghua datan del período de los Reinos Combatientes, justo antes del primer imperio chino. Conservan versiones tempranas de textos sobre política, historia y filosofía que, o bien influyeron en la tradición posterior, o bien se perdieron en ella. Para entender de verdad estos escritos, los investigadores necesitan saber cómo se agruparon las tablillas, qué partes pertenecen al mismo manuscrito y cuántos escribas trabajaron en ellas. Tradicionalmente, los expertos responden a estas preguntas a simple vista, valorando la suavidad del trazo, la presión y la disposición. Esta práctica es lenta, subjetiva y difícil de escalar conforme aparecen nuevos hallazgos.
Convertir los trazos en datos
Los autores se propusieron enseñar a un ordenador a comparar caracteres manuscritos individuales recortados de fotos de alta resolución de las tablillas. Primero construyeron una gran colección de imágenes: 15.745 caracteres individuales de 11 escribas previamente identificados, basándose en estudios paleográficos por consenso. Usando software profesional de procesamiento de imágenes, eliminaron el ruido de fondo, aislaron cada carácter dentro de un rectángulo y filtraron signos dañados o superpuestos. Luego aumentaron las clases más pequeñas —es decir, los escribas con solo unas pocas piezas supervivientes— mediante trucos simples como volteos, rotaciones, recortes y adición de ruido, para que el algoritmo no se sesgara hacia estilos más comunes.
Una red gemela que busca semejanzas
En lugar de pedir al ordenador que nombrara al autor de cada carácter, el equipo planteó una pregunta más sencilla pero más flexible: ¿provienen estas dos imágenes de la misma mano? Para ello emplearon una red neuronal “siamesa”, un par de ramas de procesamiento de imágenes idénticas que comparten parámetros. Cada rama convierte la imagen de un carácter en una huella numérica compacta. El sistema mide luego la distancia entre ambas huellas: distancias pequeñas sugieren el mismo escriba; distancias mayores, escribas diferentes. En el núcleo de cada rama hay un modelo ligero mejorado llamado MobileNet_V3+, potenciado con un mecanismo de atención que aprende a enfatizar las características visuales más reveladoras —curvas sutiles, grosor del trazo o maneras preferidas de formar partes de los caracteres— mientras atenúa detalles menos útiles.

Qué tan bien funciona el sistema
En el conjunto de datos de Tsinghua, la mejor versión del modelo acertó aproximadamente el 90 % de las veces al juzgar si pares de caracteres provenían del mismo escriba, con una puntuación muy alta en una prueba estándar de discriminación binaria. Superó a varios sistemas de reconocimiento de imágenes más pesados, como ResNet, VGG y Vision Transformers, que tendían a sobreajustarse a los datos limitados o a pasar por alto las señales estilísticas finas necesarias para esta tarea. Las inspecciones visuales de los “mapas de atención” de la red mostraron que, a medida que avanzaba el entrenamiento, el modelo dejó de fijarse en la silueta general y se centró en segmentos clave del trazo —muy parecido a un experto humano.
Ayudando a resolver debates académicos reales
Para comprobar si la herramienta era útil fuera del laboratorio, los autores la aplicaron a varios manuscritos en bambú cuya autoría se ha debatido durante años. Para tres textos (“Ji Gong”, “Hou Fu” y “She Ming”), estudios previos llevaron a los expertos a creer gradualmente que habían sido escritos por el mismo escriba dentro del grupo más amplio “Yin Zhi”. El modelo respaldó con fuerza esta conclusión, encontrando similitud muy alta en todos los emparejamientos. Para otro par de manuscritos, “Zhi Zheng” y “Zhi Bang”, los investigadores discutían si intervino un único escriba o varios. Las comparaciones de la red sugirieron que las páginas 1–42 de “Zhi Zheng” formaban un estilo escribal distinto, mientras que la página 43 de “Zhi Zheng” coincidía estrechamente con “Zhi Bang” pero no con las páginas anteriores —evidencia de dos escribas separados que no encajaban en ninguna categoría definida con anterioridad.
Qué significa esto para el pasado y el futuro
En términos sencillos, este trabajo demuestra que un sistema de IA compacto puede identificar con fiabilidad cuándo dos pequeños fragmentos de caligrafía antigua probablemente proceden de la misma mano, incluso cuando solo analiza caracteres aislados. No sustituirá el juicio experto, pero puede rastrear rápidamente grandes colecciones, señalar coincidencias probables y ofrecer respaldo cuantitativo a favor o en contra de agrupaciones concretas de tablillas. Más allá del depósito de Tsinghua, el mismo enfoque podría adaptarse a otros registros frágiles, desde huesos oraculares hasta pergaminos de la Ruta de la Seda, ayudando a historiadores y lingüistas a reconstruir cómo las ideas se movieron a través del tiempo y el espacio.
Cita: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8
Palabras clave: tablillas de bambú, análisis de caligrafía, aprendizaje profundo, patrimonio cultural, red siamesa