Clear Sky Science · es

Un modelo de difusión con inyección multi-prior y atención con compuerta para la restauración de imágenes del arte rupestre de Huashan

· Volver al índice

Devolver vida a las pinturas rupestres antiguas

El arte rupestre de Zuojiang Huashan, en el sur de China, es una extensa galería en acantilados pintada hace más de dos mil años. Hoy, muchas de esas figuras y símbolos ocres están muy desvanecidos, agrietados o faltan por completo. Este artículo presenta un método digital que utiliza técnicas avanzadas de generación de imágenes para reparar virtualmente estas frágiles obras, con el objetivo de apoyar la conservación cuidadosa, la investigación y la apreciación pública sin tocar la roca.

Figure 1
Figure 1.

Por qué importan estas pinturas en los acantilados

El arte rupestre de Huashan se extiende a lo largo de empinados acantilados fluviales y representa figuras humanas en cuclillas, escenas rituales y otras formas simbólicas en tonos rojos llamativos. Es uno de los complejos de arte rupestre más grandes y ricos del sur de China y del sudeste asiático, y una parte clave del patrimonio cultural zhuang. Pero los pigmentos, hechos a partir de minerales ricos en hierro, son muy vulnerables a la lluvia, el viento, el crecimiento biológico y el contacto humano. A lo largo de los siglos esto ha provocado colores desvaídos, contornos rotos, desconchados y texturas envejecidas y ruidosas que pueden ser difíciles de distinguir de los motivos pintados. La restauración manual tradicional es lenta, subjetiva y difícil de reproducir, lo que complica la protección a gran escala de un sitio tan amplio y frágil.

Cómo puede ayudar la restauración inteligente

La restauración digital de imágenes ofrece una forma de “rellenar los vacíos” virtualmente, siguiendo el principio de intervención mínima de la conservación. En lugar de repintar el acantilado, los ordenadores infieren las formas y texturas probables en las áreas faltantes, produciendo resultados coherentes y reversibles que pueden almacenarse en archivos de alta resolución, utilizarse para el estudio y compartirse con el público mediante exposiciones y experiencias inmersivas. Trabajos previos de inteligencia artificial aplicados al patrimonio cultural se han centrado principalmente en detectar daños o segmentar motivos, o en restaurar murales donde las formas y texturas son más regulares. El arte rupestre plantea un reto más duro: su significado reside en contornos sutiles y poses simbólicas, mientras que sus superficies están muy erosionadas e irregulares. Un método de restauración debe respetar las formas originales al tiempo que completa texturas rotas de manera verosímil, sin inventar en exceso.

Un nuevo conjunto de datos para superficies rocosas erosionadas

Los autores primero construyen un conjunto de imágenes dedicado a la restauración del arte rupestre de Huashan. Recopilan 528 imágenes candidatas de atlas impresos y fuentes públicas en línea, y luego las filtran cuidadosamente para conservar 177 que muestran claramente motivos rupestres junto con degradación visible como desvanecimiento, descamación y límites difuminados. Todas las imágenes seleccionadas se convierten a un formato de color común y se redimensionan a 512×512 píxeles, con la región pintada principal centrada. Para entrenar y evaluar métodos de restauración de forma controlada, generan tríos para cada muestra: (1) una imagen de referencia limpia, (2) una imagen de entrada donde el 30–65 % del área está enmascarada con parches negros para simular el daño, y (3) una máscara que indica las regiones faltantes. Esta configuración permite una evaluación objetiva a nivel de píxel de qué tan bien distintos métodos pueden reconstruir la obra subyacente.

Figure 2
Figure 2.

Enseñar al modelo a respetar la forma y la superficie

El núcleo del artículo es un marco de restauración basado en modelos de difusión, una clase reciente de métodos generativos que transforman gradualmente ruido en imágenes mediante muchos pequeños pasos de desruido. En lugar de tratar todas las pistas visuales como un único paquete, los autores dividen la guía en dos “prioris” separados: uno que enfatiza la estructura (bordes y contornos tipo trazo) y otro que enfatiza la textura (granulado fino y aspereza superficial). Estos prioris se calculan a partir de las partes aún visibles de una imagen dañada usando filtros deterministas y luego se codifican en mapas de características. Un módulo de fusión con atención con compuerta decide, en cada paso de desruido, cuánto confiar en la guía estructural frente a la textural y con qué intensidad inyectarlas en el proceso de difusión. Al principio, el sistema se apoya más en los contornos estables; más adelante, a medida que se reduce el ruido, presta más atención a reconstruir detalles de textura que coincidan con la superficie rocosa circundante.

Qué tan bien funciona el restaurador digital

El equipo entrena y evalúa su método en el conjunto de Huashan, comparándolo con una amplia gama de modelos existentes de restauración de imágenes, desde redes clásicas codificador–decodificador hasta enfoques generativos avanzados y de espacio de estado. Usando medidas estándar de error, nitidez y similitud estructural, su modelo alcanza errores a nivel de píxel más bajos y mayor acuerdo estructural que todos los baselines en el conjunto de prueba de arte rupestre. Estudios de ablación muestran que cada componente añadido —la extracción de prioris en doble rama y la fusión con atención con compuerta— aporta mejoras claras. Las comparaciones visuales revelan una continuidad más suave de contornos humanos y simbólicos y una integración más natural de las áreas restauradas con los fondos erosionados. Los mapas de atención además indican que el modelo se centra en bordes faltantes, contornos clave de los símbolos y zonas de transición de textura, en lugar de repintar a ciegas grandes áreas.

Qué significa esto para proteger el pasado

Para quienes no son especialistas, la conclusión principal es que este método ofrece una forma más cautelosa e interpretable de reparar digitalmente pinturas rupestres antiguas. Al separar las pistas de forma y superficie y ajustar su influencia a lo largo del tiempo, el modelo puede reconectar figuras rotas y rellenar parches faltantes manteniendo el aspecto y la sensación material del acantilado original. Los autores subrayan que su sistema es una herramienta para ayudar, no para sustituir, el juicio experto, y que se necesitan datos más diversos y evaluaciones por especialistas. Aun así, el trabajo apunta hacia un futuro en el que el arte rupestre en peligro pueda ser documentado, estudiado y compartido en forma digitalmente restaurada, preservando tanto el impacto visual como el significado cultural sin intervención física.

Cita: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

Palabras clave: restauración de arte rupestre, patrimonio cultural, modelos de difusión, reconstrucción de imágenes, pinturas de Huashan