Clear Sky Science · es
Marco progresivo de tres etapas para la restauración por inpainting de textos antiguos Dongba
Por qué importa salvar la escritura pictográfica antigua
Para el pueblo Naxi del suroeste de China, los libros Dongba son una puerta a mil años de historias, rituales y vida cotidiana. Estos libros están escritos en una rara escritura similar a imágenes que mezcla iconos y palabras. El tiempo, la humedad y el manejo han dañado muchas páginas, dejando agujeros y trazos perdidos que dificultan la lectura o incluso el reconocimiento de los símbolos. Este estudio presenta un nuevo método digital para "rellenar los huecos" de estos textos frágiles, con el objetivo de restaurar tanto la apariencia como el significado de la escritura, ofreciendo una herramienta potente para la preservación cultural.
De páginas rotas a restauración digital
Los conservadores llevan mucho tiempo intentando reparar manuscritos dañados de forma física, pero hoy la restauración digital ofrece una vía adicional: en lugar de tocar el original, los ordenadores pueden reconstruir las partes perdidas en una imagen escaneada. Para texto impreso corriente, los algoritmos modernos ya hacen un trabajo aceptable al adivinar letras perdidas a partir de las formas y patrones circundantes. Los libros Dongba representan un reto mayor. Cada símbolo es un pequeño dibujo cuyas líneas transmiten tanto estilo visual como significado. Si el software simplemente completa las líneas para que queden suaves, puede cambiar accidentalmente el símbolo por otro que nunca existió, distorsionando el registro cultural. Los autores sostienen que cualquier restauración seria debe respetar tanto la apariencia pictórica como las reglas estrictas del sistema de escritura.

Un viaje de tres pasos desde el contorno al significado
El equipo de investigación propone un marco progresivo de tres etapas, llamado TsP, diseñado específicamente para páginas Dongba muy dañadas. En la primera etapa, el sistema se centra únicamente en los contornos. Toma la imagen dañada, detecta dónde estuvieron los trazos y utiliza un híbrido de dos técnicas potentes—redes convolucionales, buenas en detalles locales, y redes Transformer, buenas en estructura global—para reconstruir de forma aproximada los bordes perdidos. El resultado es un mapa de contorno aproximado, como un esbozo que sugiere la forma general del carácter incluso donde faltan partes.
Permitir que un diccionario digital guíe la reparación
En la segunda etapa, el sistema incorpora conocimiento sobre el Dongba. Los investigadores construyeron un diccionario digital de símbolos Dongba de uso común, que incluye muchos estilos de caligrafía para cada uno. El algoritmo compara el contorno reparado de la etapa uno con todas las entradas de ese diccionario y encuentra el carácter completo más similar. No lo hace leyendo etiquetas de texto, sino midiendo cuán parecidas son las formas en un sentido estadístico. El símbolo elegido actúa como un "prior de contenido": la mejor suposición de cuál debería ser el carácter faltante, proporcionando pistas semánticas y detalles finos de trazos que un método puramente visual no captaría.
Pulir la imagen final
En la tercera y última etapa, TsP combina dos corrientes de información: el contorno estructural de la primera fase y el carácter completo del diccionario. Una red neuronal de doble rama especialmente diseñada extrae características de ambas fuentes, una rama centrada en la disposición de los trazos y otra en los patrones de contenido más ricos. Estas características guían un módulo de restauración que opera no solo en el espacio de la imagen sino también en el dominio de la frecuencia, donde se pueden ajustar más eficazmente patrones como la suavidad general y el ritmo de los trazos. Esta pasada final limpia artefactos, añade partes faltantes de los trazos y suaviza las transiciones entre regiones antiguas y recién generadas para que el carácter reparado se integre de forma natural en la página original.

¿Qué tan bien funciona?
Para evaluar su enfoque, los autores utilizaron DB1404, el único gran conjunto de datos público de caracteres Dongba, que incluye miles de símbolos capturados en muchos estilos. Crearon "daños" digitales de diversa gravedad, enmascarando desde una pequeña porción de cada imagen hasta la mitad, usando agujeros irregulares y arañazos que imitan el deterioro real. TsP se comparó con métodos líderes de reparación de imágenes, incluyendo herramientas clásicas, sistemas modernos basados en Transformer y modelos de difusión. En todos los niveles de daño, TsP produjo imágenes que eran tanto visualmente más convincentes como estructuralmente más cercanas a los caracteres originales, especialmente cuando faltaban grandes porciones—exactamente la situación más crítica para manuscritos raros y frágiles.
Qué significa esto para la escritura antigua
En términos sencillos, este trabajo muestra que los ordenadores pueden aprender no solo a alisar grietas en una imagen, sino a respetar las reglas y el sentido de un sistema de escritura antiguo al hacerlo. Al primero adivinar el esqueleto de un carácter dañado, luego emparejarlo con un símbolo conocido y finalmente usar ambos como guía para un inpainting cuidadoso, TsP preserva mejor la forma y el sentido originales de la escritura Dongba. Más allá de un logro técnico, este enfoque podría ayudar a bibliotecarios, historiadores y comunidades locales a recuperar el contenido de manuscritos que de otro modo quedarían ilegibles, y ofrece un modelo para restaurar otros sistemas de escritura en peligro en todo el mundo.
Cita: Bi, X., Shi, Q. & Chen, Z. Three-stage progressive framework for Dongba ancient texts inpainting. npj Herit. Sci. 14, 240 (2026). https://doi.org/10.1038/s40494-026-02524-5
Palabras clave: Manuscritos Dongba, restauración de escritura antigua, inpainting de imágenes, digitalización del patrimonio cultural, aprendizaje profundo