Clear Sky Science · es

Mejora de la interacción multimodal en sistemas digitales de patrimonio cultural: análisis del comportamiento de usuarios y reconstrucción de la interfaz de la biblioteca de escaneos del Museo del Palacio

· Volver al índice

Llevando la Ciudad Prohibida a tu pantalla

El Museo del Palacio de Pekín, hogar de los tesoros de la Ciudad Prohibida, ha invertido enormes esfuerzos en digitalizar sus obras y objetos. Visitantes de cualquier lugar del mundo pueden ahora acercarse a detalles exquisitos que antes requerían lupa y una visita especial. Sin embargo, mucha gente abandona las páginas tras pocos minutos, impresionada por las imágenes pero sin tener claro qué ha aprendido realmente. Este estudio plantea una pregunta sencilla con grandes implicaciones: ¿cómo puede rediseñarse un museo digital para que visitantes comunes, no solo expertos, sientan y comprendan de verdad la cultura detrás de las imágenes?

Figure 1
Figure 1.

De imágenes nítidas a comprensión superficial

Los investigadores comienzan señalando una tensión en el núcleo de muchos proyectos de patrimonio digital. Los escaneos de alta precisión y los modelos 3D capturan cada grieta en un esmalte cerámico o cada trazo en una pintura de pergamino. Pero los sistemas en línea que muestran estas maravillas a menudo tratan al usuario como un espectador pasivo. La interacción se limita en gran medida a rotar, hacer zoom y desplazarse por descripciones largas y técnicas. Como resultado, los significados culturales ricos quedan enterrados bajo términos especializados y la mayoría de los visitantes terminan “viendo cosas sin conocer sus historias”. La biblioteca digital de reliquias del Museo del Palacio es un ejemplo claro: técnicamente impresionante, pero fragmentada en su narrativa y difícil de navegar para no expertos.

Observar los ojos para entender las mentes

Para descubrir qué hacen realmente distintos visitantes en estas páginas, el equipo realizó experimentos de seguimiento ocular con tres grupos: académicos profesionales, aficionados a la historia y turistas generales. Los participantes completaron tareas que iban desde la exploración libre hasta búsquedas dirigidas y operaciones complejas, como comparar artefactos relacionados. Pequeñas cámaras en gafas especiales registraron dónde fijaban la vista, cuánto tiempo se detenían y cómo saltaba su mirada por la pantalla. Al mismo tiempo, un software registró clics de ratón y desplazamientos, y tras cada sesión los voluntarios calificaron la demanda mental de las tareas y participaron en entrevistas en profundidad sobre lo que les confundió o ayudó.

Tres maneras de mirar el mismo objeto

Los datos revelaron tres patrones distintos de atención y comportamiento. Los académicos pasaron la mayor parte del tiempo en paneles técnicos que listan materiales, dimensiones y fechas, moviéndose en una ruta ordenada y lineal desde la imagen principal a los datos y a los elementos relacionados. Completaron las tareas con rapidez y informaron la menor carga mental. Los aficionados, en cambio, alternaron constantemente entre la imagen principal y las secciones que explican contexto histórico y simbolismo, usando las historias para profundizar su comprensión. Los turistas se centraron en gran medida en la imagen 3D principal y en recomendaciones llamativas, y con frecuencia se perdieron en la interfaz. Malinterpretaron etiquetas de categoría, tropezaron con términos como “dorados”, realizaron muchos más clics erróneos y declararon sentirse sobrecargados e inseguros sobre qué hacer a continuación. En otras palabras, la misma página servía bien a los expertos, intrigaba a los aficionados y, silenciosamente, excluía a los recién llegados.

Figure 2
Figure 2.

Diseñar un museo que escuche y responda

Apoyándose en teorías de la empatía y la “materialidad” de los medios, los autores sostienen que el patrimonio digital debe pasar de una exhibición estática a una experiencia más sensorial y rica en historias. Proponen un rediseño multimodal centrado en la fusión de la vista y el sonido. Visualmente, las páginas ganarían guías claras y dinámicas que resaltan detalles importantes, muestran puntos activos en motivos como dragones o texturas de laca y reordenan secciones según las trayectorias típicas de la mirada. A nivel sonoro, cada objeto ofrecería explicaciones de audio por capas: comentario experto para académicos, narración para los aficionados e introducciones en lenguaje claro para visitantes ocasionales. Un sistema de preguntas y respuestas por voz permitiría a los usuarios formular preguntas naturales y recibir respuestas breves y a medida, mientras que simulaciones sonoras sutiles —como el tintineo de una campana de bronce o el roce del trabajo en laca— evocarían la presencia física de los objetos.

De hacer clics a vivir la cultura

Para el lector general, la conclusión es que un buen museo digital no es solo una galería de imágenes en alta resolución. Debería sentirse más como entrar en una visita guiada que se adapta a quién eres y a cómo exploras. Al mostrar cómo distintos tipos de usuarios se comportan en el sitio del Museo del Palacio, este estudio presenta un argumento práctico para rediseñar los sistemas de patrimonio digital en torno a la percepción humana y no solo a la tecnología. Los autores aún no implementan su visión completa, pero trazan una hoja de ruta clara: usar datos reales de comportamiento para impulsar visuales más intuitivos, sonido más rico y narraciones por capas. Si se lleva a cabo, este enfoque podría convertir la navegación rápida y superficial en viajes inmersivos donde las personas no solo admiran objetos antiguos, sino que también conectan con las vidas, habilidades y valores que encarnan.

Cita: Ke, L., Qin, H., Long, J. et al. Multimodal interaction enhancement of digital cultural heritage system: user behavior analysis and interface reconstruction of the heritage scanning library of the palace museum. Sci Rep 16, 10654 (2026). https://doi.org/10.1038/s41598-026-44955-x

Palabras clave: patrimonio cultural digital, Museo del Palacio, diseño de interfaces para museos, interacción multimodal, experiencia de usuario