Clear Sky Science · es

Segmentación semántica de nubes de puntos faciales de Buda mediante crecimiento de regiones guiado por conocimiento

2026-02-18 · Volver al índice

Leer el rostro de la historia

Las estatuas de Buda esculpidas en acantilados y muros de templos son más que bellas obras de arte: son registros tridimensionales de creencias religiosas, modas artísticas e intercambios culturales a lo largo de los siglos. Este estudio muestra cómo científicos informáticos y expertos en patrimonio pueden “leer” estas caras de piedra en detalle separando automáticamente ojos, nariz, boca y otros rasgos a partir de mediciones 3D densas, incluso cuando no existen ejemplos etiquetados para aprender. El objetivo es convertir la piedra silenciosa en datos mensurables que ayuden a los historiadores a comparar estilos, rastrear cambios en el tiempo y planificar una conservación cuidadosa.

Por qué importan los rostros digitales

En sítos famosos como Dunhuang, Yungang y Longmen, los rostros de Buda difieren sutilmente según dinastía y región: algunos son más llenos, otros más estilizados, algunos con ojos más suaves o narices más prominentes. Tradicionalmente, los historiadores del arte describen estas diferencias a simple vista; ahora, los escaneos 3D de alta precisión capturan la superficie de las estatuas como millones de puntos en el espacio. Sin embargo, estas “nubes de puntos” son desordenadas: carecen de color o textura y no ofrecen indicación intrínseca de dónde termina el ojo y comienza la mejilla. Los métodos automáticos existentes o requieren muchos ejemplos anotados a mano —que sencillamente no existen para las estatuas patrimoniales— o dividen las superficies puramente por geometría, ignorando las reglas escultóricas que los artistas realmente siguieron.

Enseñar a los algoritmos las reglas del rostro

En lugar de intentar aprender a partir de datos escasos, los autores parten del conocimiento que empleaban los propios escultores. Los manuales budistas tradicionales describen proporciones faciales estándar, como dividir el rostro en tercios iguales para frente, nariz y barbilla, y mantener los rasgos simétricos alrededor de un eje central. Los investigadores traducen este saber cultural y anatómico en reglas geométricas sencillas: un plano de simetría por el centro; una línea vertical que atraviesa el centro de la nariz; y razones que relacionan las posiciones y tamaños de ojos, nariz, boca, orejas y barbilla. Estas reglas no son plantillas rígidas: incluyen parámetros ajustables para que tanto los rostros más llenos al estilo Tang como los más esbeltos al estilo Song encajen en un marco flexible pero reconocible.

Hacer crecer regiones desde semillas

Partiendo de un escaneo 3D limpio, el método alinea primero el rostro de Buda de modo que mire de frente y luego proyecta la superficie sobre una cuadrícula cuadrada, convirtiendo la forma 3D en algo parecido a un mapa de alturas sombreado. Dentro de esta cuadrícula, el algoritmo elige posiciones iniciales “semilla” para cada rasgo facial, ayudado por las reglas previas: la semilla de la nariz se sitúa cerca de la línea vertical central y de un punto local alto, los ojos se colocan en picos simétricos a ambos lados, la boca descansa bajo la nariz en una depresión poco profunda, etc. Desde cada semilla, el ordenador “hace crecer” una región hacia afuera, añadiendo celdas vecinas solo cuando su altura e inclinación encajan con lo que esperarías para, por ejemplo, una cresta nasal en lugar de una mejilla. Pasos adicionales limpian el resultado, recortando fragmentos sueltos, rellenando huecos pequeños y suavizando ligeramente los contornos para que los ojos, labios y barbilla segmentados parezcan continuos y plausibles tanto para la máquina como para un experto humano.

Poniendo el método a prueba

El equipo probó su enfoque en quince rostros de Buda: nueve modelos sintéticos con formas controladas y seis escaneos reales de reconocidos sitios patrimoniales chinos. Midieron la calidad por cuánto se solapaban las regiones segmentadas automáticamente con contornos dibujados cuidadosamente a mano por especialistas y por la cercanía entre los límites calculados y los contornos de los expertos. En ojos, cejas, orejas, nariz, boca y barbilla, el método alcanzó puntuaciones altas, lo que significa que la mayoría de los puntos se asignaron correctamente al rasgo correspondiente. Importante: los resultados fueron estables frente a distintos estilos de talla y niveles de desgaste superficial. Cuando los autores compararon su enfoque con un modelo de aprendizaje profundo popular entrenado con solo unos pocos ejemplos etiquetados, la red hambrienta de datos tuvo serias dificultades, mientras que el método guiado por conocimiento se mantuvo preciso sin necesitar grandes conjuntos de entrenamiento.

Qué significa esto para el patrimonio

Al codificar las reglas tradicionales de medida de los escultores en un algoritmo moderno, este estudio demuestra que los ordenadores pueden segmentar rostros de Buda en 3D con poco o ningún etiquetado manual, respetando al mismo tiempo la lógica cultural de la obra original. Para los historiadores, esto abre la puerta a comparaciones sistemáticas y cuantitativas de estilos faciales entre sitios y períodos; para los conservadores, ofrece una forma precisa de monitorizar daños o guiar restauraciones digitales. En esencia, el método convierte convenciones centenarias sobre el rostro ideal del Buda en una herramienta práctica para leer, preservar y comprender las caras de piedra que han vigilado templos y grutas durante más de mil años.

Cita: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

Palabras clave: escaneo 3D de estatuas de Buda, digitalización del patrimonio cultural, segmentación de nubes de puntos, proporciones faciales en el arte, algoritmos guiados por conocimiento