Clear Sky Science · fr

Amélioration de l’interaction multimodale des systèmes de patrimoine culturel numérique : analyse du comportement des utilisateurs et reconstruction de l’interface de la bibliothèque de numérisation du Musée du Palais

· Retour à l’index

Apporter la Cité Interdite à votre écran

Le Musée du Palais à Pékin, qui conserve les trésors de la Cité interdite, a déployé d’importants efforts pour numériser ses œuvres et objets. Les visiteurs du monde entier peuvent désormais zoomer sur des détails exquis qui exigeaient autrefois une loupe et une visite spéciale. Pourtant, beaucoup quittent encore le site après quelques minutes seulement, impressionnés par les images mais incertains de ce qu’ils ont réellement appris. Cette étude pose une question simple aux implications larges : comment repenser un musée numérique pour que des visiteurs ordinaires, et pas seulement des spécialistes, ressentent et comprennent véritablement la culture qui se cache derrière les images ?

Figure 1
Figure 1.

Des images nettes à une compréhension superficielle

Les chercheurs commencent par souligner une tension au cœur de nombreux projets de patrimoine numérique. Les scans haute précision et les modèles 3D capturent chaque fissure d’un vernis céramique ou chaque trait d’un rouleau peint. Mais les systèmes en ligne qui exposent ces merveilles traitent souvent les visiteurs comme des spectateurs passifs. L’interaction se limite le plus souvent à faire pivoter, zoomer et faire défiler de longues descriptions techniques. En conséquence, des significations culturelles riches restent enfouies sous un jargon de spécialistes, et la plupart des visiteurs se contentent de « voir sans connaître les histoires ». La bibliothèque numérique des reliques du Musée du Palais en est un exemple type : techniquement impressionnante, mais narrativement fragmentée et difficile à appréhender pour les non‑experts.

Observer le regard pour comprendre l’esprit

Pour découvrir ce que différents visiteurs font réellement sur ces pages, l’équipe a réalisé des expériences d’oculométrie avec trois groupes : des chercheurs professionnels, des passionnés d’histoire et des touristes lambda. Les participants ont exécuté des tâches allant de l’exploration libre à des recherches ciblées et des opérations complexes comme la comparaison d’objets apparentés. De minuscules caméras dans des lunettes spéciales ont enregistré où leurs yeux se posaient, combien de temps ils s’attardaient et comment leur regard sautait à travers l’écran. En parallèle, un logiciel consignait les clics de souris et le défilement, et après chaque session les volontaires évaluaient la charge mentale ressentie et participaient à des entretiens approfondis sur ce qui les avait confus ou aidés.

Trois façons de regarder le même objet

Les données ont révélé trois schémas distincts d’attention et de comportement. Les chercheurs passaient la majeure partie de leur temps sur des panneaux techniques listant matériaux, dimensions et datations, suivant un cheminage linéaire et ordonné de l’image principale aux données puis aux objets associés. Ils réalisaient les tâches rapidement et rapportaient la moindre fatigue cognitive. Les passionnés, en revanche, alternaient en permanence entre l’image principale et des sections expliquant le contexte historique et le symbolisme, utilisant le récit pour approfondir leur compréhension. Les touristes se concentraient fortement sur l’image 3D principale et sur des recommandations accrocheuses, se perdant souvent dans l’interface. Ils malinterpretaient des étiquettes de catégorie, butaient sur des termes comme « doré », effectuaient beaucoup plus d’erreurs de clic et déclaraient se sentir surchargés et incertains de la marche à suivre. Autrement dit, la même page servait bien les experts, intriguait les passionnés et excluait discrètement les novices.

Figure 2
Figure 2.

Concevoir un musée qui écoute et répond

S’appuyant sur des théories de l’empathie et de la « matérialité » des médias, les auteurs soutiennent que le patrimoine numérique devrait évoluer d’une présentation statique vers une expérience plus sensorielle et riche en récits. Ils proposent une refonte multimodale centrée sur la fusion de la vue et du son. Visuellement, les pages gagneraient des guides clairs et dynamiques qui mettent en évidence les détails importants, montrent des points chauds sur des motifs comme les dragons ou les textures de laque, et réorganisent les sections selon les parcours de regard typiques. Audiblement, chaque objet offrirait des explications audio à étagement : commentaires d’experts pour les chercheurs, récits narratifs pour les passionnés et introductions en langage clair pour les visiteurs occasionnels. Un système vocal de questions‑réponses permettrait aux utilisateurs de poser des questions naturelles et de recevoir des réponses courtes et adaptées, tandis que des simulations sonores subtiles — comme le tintement d’une cloche en bronze ou le raclement d’un travail de laque — évoqueraient la présence physique des objets.

Passer du clic à l’expérience vivante de la culture

Pour un lecteur général, la conclusion est qu’un bon musée numérique n’est pas seulement une galerie d’images haute résolution. Il devrait ressembler davantage à une visite guidée qui s’adapte à qui vous êtes et à votre façon d’explorer. En montrant comment différents types d’utilisateurs se comportent réellement sur le site du Musée du Palais, cette étude constitue un argument pragmatique en faveur de la refonte des systèmes de patrimoine numérique autour de la perception humaine plutôt que de la seule technologie. Les auteurs n’ont pas encore mis en œuvre leur vision complète, mais ils en tracent une feuille de route claire : utiliser des données comportementales réelles pour piloter des visuels plus intuitifs, un son enrichi et une narration par couches. Si elle était réalisée, cette approche pourrait transformer une navigation rapide et superficielle en voyages immersifs où les gens non seulement admirent des objets anciens mais se relient aussi aux vies, aux savoir‑faire et aux valeurs qu’ils incarnent.

Citation: Ke, L., Qin, H., Long, J. et al. Multimodal interaction enhancement of digital cultural heritage system: user behavior analysis and interface reconstruction of the heritage scanning library of the palace museum. Sci Rep 16, 10654 (2026). https://doi.org/10.1038/s41598-026-44955-x

Mots-clés: patrimoine culturel numérique, Musée du Palais, conception d’interface muséale, interaction multimodale, expérience utilisateur