Clear Sky Science · pl
Ulepszenie multimodalnej interakcji w cyfrowym systemie dziedzictwa kulturowego: analiza zachowań użytkowników i rekonstruowanie interfejsu biblioteki skanów zabytków Muzeum Pałacowego
Przenosząc Zakazane Miasto na Twój ekran
Muzeum Pałacowe w Pekinie, skrywające skarby Zakazanego Miasta, włożyło ogromny wysiłek w digitalizację swoich dzieł sztuki i artefaktów. Odwiedzający z dowolnego miejsca na świecie mogą dziś przybliżyć wysublimowane detale, które kiedyś wymagały lupy i specjalnej wizyty. Mimo to wielu użytkowników rezygnuje po kilku minutach — pod wrażeniem obrazów, ale niepewnych, co naprawdę z nich wynieśli. Badanie stawia proste pytanie o dalekosiężnych konsekwencjach: jak można przeprojektować muzeum cyfrowe, aby zwykli odwiedzający, a nie tylko eksperci, autentycznie odczuli i zrozumieli kulturę stojącą za obrazami?

Od ostrych zdjęć do płytkiego zrozumienia
Naukowcy zaczynają od wskazania napięcia, które leży u podstaw wielu projektów dziedzictwa cyfrowego. Skanowanie wysokiej precyzji i modele 3D rejestrują każdą rysę w szkliwie ceramiki czy każdy pociągnięcie pędzla w rękopisie. Ale systemy internetowe prezentujące te cuda często traktują użytkowników jako biernych widzów. Interakcja ogranicza się głównie do obracania, przybliżania i przewijania długich, technicznych opisów. W efekcie bogate znaczenia kulturowe toną w terminologii specjalistycznej, a większość odwiedzających „ogląda rzeczy, nie znając ich historii”. Biblioteka cyfrowych zabytków Muzeum Pałacowego jest tu typowym przykładem: technicznie imponująca, lecz narracyjnie rozfragmentaryzowana i trudna w nawigacji dla osób bez specjalistycznej wiedzy.
Obserwując oczy, by zrozumieć umysły
Aby odkryć, co różni użytkownicy faktycznie robią na tych stronach, zespół przeprowadził eksperymenty z badaniem ruchu oczu w trzech grupach: profesjonalnych badaczy, pasjonatów historii i zwykłych turystów. Uczestnicy wykonywali zadania od swobodnej eksploracji po wyszukiwania celowane i złożone operacje, takie jak porównywanie powiązanych artefaktów. Maleńkie kamery w specjalnych okularach rejestrowały, na co padało ich spojrzenie, jak długo się zatrzymywali i jak przeskakiwał ich wzrok po ekranie. Równocześnie oprogramowanie zapisywało kliknięcia myszą i przewijanie, a po każdej sesji wolontariusze oceniali, jak obciążające mentalnie były zadania i brali udział w pogłębionych wywiadach o tym, co ich myliło lub pomagało.
Trzy sposoby patrzenia na ten sam obiekt
Dane ujawniły trzy odrębne wzorce uwagi i zachowań. Badacze spędzali najwięcej czasu na panelach technicznych wymieniających materiały, rozmiary i daty, poruszając się w uporządkowanej, liniowej ścieżce od głównego obrazu do danych i powiązanych pozycji. Wykonywali zadania szybko i zgłaszali najmniejsze obciążenie mentalne. Pasjonaci natomiast ciągle powracali między głównym obrazem a sekcjami wyjaśniającymi kontekst historyczny i symbolikę, używając opowieści do pogłębienia rozumienia. Turyści koncentrowali się silnie na głównym obrazie 3D i przyciągających uwagę rekomendacjach, często gubiąc się w interfejsie. Błędnie interpretowali etykiety kategorii, potykali się o terminy takie jak „pozłacany”, popełniali znacznie więcej błędnych kliknięć i zgłaszali poczucie przeciążenia oraz niepewności, co robić dalej. Innymi słowy — ta sama strona dobrze służyła ekspertom, intrygowała pasjonatów i cicho wykluczała nowicjuszy.

Projektowanie muzeum, które słucha i odpowiada
Opierając się na teoriach empatii i „materialności” mediów, autorzy argumentują, że dziedzictwo cyfrowe powinno przejść od statycznej ekspozycji ku bardziej sensorycznemu, bogatemu w opowieści doświadczeniu. Proponują multimodalne przeprojektowanie skoncentrowane na połączeniu wzroku i dźwięku. Wizualnie strony zyskałyby jasne, dynamiczne przewodniki podkreślające ważne detale, pokazujące punkty zainteresowania na motywach takich jak smoki czy faktury lakieru oraz przearanżowujące sekcje zgodnie z typowymi ścieżkami wzroku. Dźwiękowo każdy obiekt oferowałby warstwowe wyjaśnienia audio: komentarz ekspercki dla badaczy, narracyjne opowiadanie dla pasjonatów oraz wprowadzenia w prostym języku dla odwiedzających okazjonalnych. System głosowego pytań i odpowiedzi pozwoliłby użytkownikom zadawać naturalne pytania i otrzymywać krótkie, dopasowane odpowiedzi, a subtelne symulacje dźwiękowe — na przykład dźwięk uderzenia brązowego dzwonu czy zadrapanie przy pracach lakierniczych — przywoływałyby fizyczną obecność obiektów.
Od klikania do przeżywania kultury
Dla czytelnika ogólnego wniosek jest taki, że dobre muzeum cyfrowe to nie tylko galeria wysokiej rozdzielczości. Powinno przypominać raczej uczestnictwo w zwiedzaniu z przewodnikiem, które dostosowuje się do tego, kim jesteś i jak eksplorujesz. Pokazując, jak różne typy użytkowników rzeczywiście zachowują się na stronie Muzeum Pałacowego, badanie buduje praktyczny argument za przeprojektowaniem systemów dziedzictwa cyfrowego wokół ludzkiego postrzegania, a nie samej technologii. Autorzy nie wdrażają jeszcze swojej pełnej wizji, ale szkicują jasną mapę drogową: używać rzeczywistych danych zachowań, by napędzać bardziej intuicyjne elementy wizualne, bogatszy dźwięk i warstwowe opowiadanie historii. Jeśli zostanie to zrealizowane, podejście takie może przemienić szybkie, powierzchowne przeglądanie w immersyjne podróże, gdzie ludzie nie tylko podziwiają starożytne obiekty, lecz także łączą się z życiami, umiejętnościami i wartościami, które one ucieleśniają.
Cytowanie: Ke, L., Qin, H., Long, J. et al. Multimodal interaction enhancement of digital cultural heritage system: user behavior analysis and interface reconstruction of the heritage scanning library of the palace museum. Sci Rep 16, 10654 (2026). https://doi.org/10.1038/s41598-026-44955-x
Słowa kluczowe: cyfrowe dziedzictwo kulturowe, Muzeum Pałacowe, projektowanie interfejsu muzealnego, multimodalna interakcja, doświadczenie użytkownika