Clear Sky Science · es

Red de fusión de características voxel multiescala para la completación de nubes de puntos ruidosas a gran escala en la restauración del patrimonio cultural

2026-02-12 · Volver al índice

Devolver a las estructuras antiguas el enfoque digital

Cuando los historiadores escanean templos o monumentos históricos con láser, los datos 3D resultantes a menudo parecen más bien estática televisiva que una imagen nítida. Faltan partes de tejados o esculturas, y manchas aleatorias de puntos “fantasma” entorpecen la vista. Este artículo presenta un nuevo método de inteligencia artificial (IA) que limpia y completa esas nubes de puntos 3D, ayudando a conservadores e investigadores a ver sitios de patrimonio cultural complejos —como santuarios japoneses centenarios— con mucha mayor claridad.

Por qué los escaneos 3D de sitios patrimoniales son tan desordenados

Herramientas modernas como LiDAR y cámaras de profundidad pueden capturar millones de puntos 3D de edificios y paisajes en minutos. Pero árboles, sombras, ángulos de visión poco favorables y las limitaciones de los propios escáneres hacen que algunas zonas nunca sean “vistadas”, mientras que otras quedan corruptas por ruido. En la práctica, esto produce nubes de puntos parcheadas e irregulares donde rasgos clave —como vigas encastradas del tejado o aleros trabajados— o bien faltan o están enterrados bajo puntos espurios. Las técnicas previas de reparación digital rellenaban huecos de forma burda, difuminaban detalles finos o exigían un gran coste computacional que no escalaba bien a escenas exteriores de gran tamaño.

Una canalización de restauración digital en tres pasos

Los autores se apoyan en trabajos anteriores y proponen un marco de IA en tres etapas adaptado a escaneos 3D grandes y ruidosos de patrimonio cultural. Primero se aplica un filtrado multietapa: el algoritmo ejecuta inicialmente una prueba estadística para eliminar outliers evidentes, y luego usa un filtro guiado que examina parches superficiales locales para suavizar el ruido restante preservando formas agudas como los bordes. Segundo, los puntos limpiados se convierten en “voxeles” 3D —pequeños cubos— y se analizan a varias resoluciones simultáneamente. Rejillas gruesas capturan la estructura general de un tejado; rejillas finas capturan crestas, tejas y bordes. Estas características voxel multiescala se fusionan después mediante mecanismos de atención que permiten a la red decidir cuánto confiar en cada escala en distintas zonas del objeto.

Aguzando bordes y rellenando los vacíos

En la tercera etapa, las características fusionadas pasan por un módulo basado en Transformers que predice un “esqueleto” disperso de puntos clave que representan las regiones faltantes. Un paso especial de mejora guiada por la curvatura mide cuán pronunciadamente se dobla cada región y utiliza esa información para ajustar las características, de modo que el esqueleto predicho siga mejor los bordes y las esquinas reales en vez de redondearlos. Finalmente, un módulo de upsampling expande este esqueleto hasta una nube de puntos densa y completada que busca coincidir con la superficie real manteniendo una distribución uniforme de puntos, evitando agrupaciones o huecos que distraigan a los observadores o induzcan a error a los analistas.

¿Qué tan bien funciona en la práctica?

El equipo probó su enfoque tanto en formas sintéticas como en escaneos reales. En un benchmark estándar de modelos 3D (ShapeNet‑55), su método recuperó partes faltantes con mayor precisión que varias redes líderes, mejorando una medida clave de distancia hasta en aproximadamente un 16 por ciento mientras mantenía alta la completitud. Más importante para aplicaciones patrimoniales, ensamblaron un conjunto de datos de tejados de templos japoneses derivados de escaneos láser reales que incluyen ruido del mundo real. Allí, el método superó claramente a las alternativas, especialmente cuando los datos estaban fuertemente contaminados. En comparaciones visuales, la canalización propuesta produjo tejas más nítidas, aleros más fieles y menos artefactos. Aplicado al escaneo a gran escala del santuario Tamaki‑jinja —más de 25 millones de puntos— fue capaz de reconstruir secciones de tejado faltantes y refinar superficies ruidosas dentro de un presupuesto práctico de tiempo y memoria.

Ver a través de las superficies con datos más claros

Los investigadores también integraron su método de completación con una técnica de visualización transparente que habían desarrollado anteriormente, que permite a los espectadores “ver a través” de las superficies externas de nubes de puntos densas hasta las estructuras internas. En los datos originales ruidosos, las vistas transparentes de los tejados de Tamaki‑jinja resultaban confusas: huecos, puntos sueltos y regiones faltantes ocultaban la estructura real. Tras aplicar el nuevo marco de completación, las mismas vistas mostraron contornos de tejados y aleros mucho más claros, facilitando la interpretación de cómo está ensamblado el edificio. Aunque el método todavía tiene dificultades en áreas donde los escaneos son extremadamente incompletos o están abrumados por el ruido, mejora sustancialmente tanto la precisión geométrica como la legibilidad visual en la mayoría de las zonas.

Lo que esto significa para el patrimonio cultural

En términos sencillos, este trabajo proporciona un “restaurador digital” más inteligente para escaneos 3D de sitios históricos. Al limpiar los datos con cuidado, comprender las formas en múltiples escalas y prestar especial atención a bordes y curvas, el método puede reconstruir de forma plausible partes faltantes de edificios evitando resultados excesivamente suavizados o distorsionados. Para conservadores, arquitectos e historiadores, esto se traduce en modelos virtuales más fiables para estudio, planificación de conservación y exhibiciones públicas, incluidas vistas inmersivas que permiten ver a través de complejos entramados de madera. Aunque el enfoque no reemplaza la conservación física, ofrece una herramienta potente para preservar y explorar la geometría del frágil patrimonio cultural en el ámbito digital.

Cita: Li, W., Pan, J., Hasegawa, K. et al. Multiscale voxel feature fusion network for large scale noisy point cloud completion in cultural heritage restoration. npj Herit. Sci. 14, 93 (2026). https://doi.org/10.1038/s40494-026-02331-y

Palabras clave: nube de puntos 3D, patrimonio cultural, escaneo LiDAR, aprendizaje profundo, restauración digital