Clear Sky Science · sv
Semantisk segmentering och rumslig rutnätsanalys av kinesiska kulturarvslandskaps fotografiska kompositioner med tvärkulturella perspektiv
Hur semesterfoton avslöjar vad vi älskar med trädgårdar
När vi reser tar vi otaliga bilder utan att reflektera särskilt över vad de säger. Ändå blottlägger det vi väljer att rama in – en stilla damm, en svepande bro eller ett utsirade paviljong – tyst vad vi värdesätter och hur vi uppfattar en plats. Denna studie omvandlar tusentals turistbilder från två världsberömda kinesiska klassiska trädgårdar till data, och använder avancerad bildanalys för att kartlägga hur besökare från olika kulturer visuellt upplever dessa kulturarvslanskapsmiljöer och hur den kunskapen kan vägleda bättre bevarande och utformning för besökare.

Att göra vardagliga snapshots till användbara ledtrådar
Forskarlaget koncentrerade sig på två ikoniska platser: Sommarpalatset i Peking, med sin vidsträckta sjö och imponerande byggnader, och Förvaltaren av ödmjukhetens trädgård i Suzhou, känd för intima gårdar och litterär charm. De samlade in mer än 9 000 användarladdade fotografier från två reseplattformar. Den ena plattformen betjänar främst kinesiska användare och representerar östliga besökare; den andra är populär bland internationella resenärer och står för västerländska besökare. Istället för att fråga människor vad de gillade genom enkäter behandlade teamet varje semesterminne som en registrering av vad som fångade en besökares uppmärksamhet i det ögonblicket.
Att lära en dator att se trädgårdselement
För att läsa dessa bilder systematiskt använde teamet en djupinlärningsmetod kallad semantisk segmentering, som lär datorn att färglägga varje pixel enligt vad den föreställer. De reducerade en lång lista visuella etiketter till tio lättigenkännliga trädgårdsingredienser såsom träd och växter, vatten, byggnader, inhägnande murar, gångar och broar, bergs- eller stenformationer samt dekorativa möbler. För varje foto noterade systemet om ett element över huvud taget förekom och hur stor del av bilden det upptog. Därefter lade författarna ett enkelt tre gånger tre-rutnät över bilden – liknande den välkända "tredjedelsregeln" inom fotografin – för att se var i bilden varje typ av element tenderade att placera sig: högt eller lågt, i mitten eller vid sidan.

Vad besökare faktiskt riktar sina kameror mot
Pixel-för-pixel-analysen visade tydliga mönster. I båda trädgårdarna och bland båda turistgrupperna var grönska nästan universell, närvarande i mer än 95 % av bilderna och ofta den största beståndsdelen i ramen. Vattenspeglar, även om de var mindre frekventa, spred sig ofta brett när de väl förekom och skapade öppna, luftiga scener. Vissa ingredienser var ovanligare men effektfulla när de användes – till exempel stora byggnader eller långa broar som, när de väl inkluderades, ofta dominerade fotot. Genom att räkna hur många olika elementtyper som förekom tillsammans fann teamet att de flesta bilder innehöll mellan en och fem komponenter, en balans mellan enkelhet och rikedom. Västerländska besökare tenderade att fånga mer varierade blandningar av element i vissa områden, medan kinesiska besökare visade mer stabila mönster över båda trädgårdarna.
Olika ögon, olika kompositioner
Att titta på var elementen föll inom rutnätet avslöjade kulturella kontraster i hur scener rammades in. Foton tagna av kinesiska turister var oftare centrerade och balanserade, och fyllde både mitten och de övre delarna av bilden – en stil som återspeglar traditionell kinesisk estetik som betonar harmoni mellan byggnader, växter och vatten. Västerländska besökare föredrog däremot "bottentunga" kompositioner, med starka förgrundselement som stigar och broar som leder in i scenen och framträdande strukturer placerade lägre i ramen. De visade också en särskild dragning till dörrar, fönster och andra öppningar som inramar en vy, särskilt i Suzhou-trädgården, medan kinesiska besökare framhävde murar, växtlighet och möbler kopplade till literaturtraditionen.
Hotspots, kulturarvshistorier och varför det spelar roll
Genom att klustra fotografier med liknande kombinationer av element kunde studien härleda populära fotograferingsplatser: sjöstränder, sicksackbroar, månportar, tempelkomplex och gårdskorridorer. Kinesiska besökare drogs till utrymmen som uttrycker imperiala berättelser och teman om harmoni, såsom pilalléer längs Kunmingsjön eller litterära paviljonger. Västerländska besökare drog sig mot iögonfallande arkitektoniska objekt – Marmorbåten, templets torn eller inramade vyer genom valv – ofta i kombination med vatten. Dessa tendenser, menar författarna, speglar djupare kulturella uppmärksamhetsvanor: vissa observatörer söker den övergripande stämningen och relationerna i en scen, medan andra fokuserar på kraftfulla, isolerade motiv.
Från pixlar till bättre trädgårdsupplevelser
I vardagligt tal visar studien att semesterbilder är mer än souvenirer: de är ett fönster in i hur olika människor "läser" samma historiska plats. Genom att avkoda vad turister väljer att inkludera, hur stort de gör det och var de placerar det i ramen får förvaltare av kulturarvsträdgårdar en objektiv karta över vad besökare faktiskt märker och vårdar. Den kunskapen kan informera allt från var stigar och utsiktsplattformar bör placeras till hur marknadsföringsbilder utformas för att tala till olika målgrupper, samtidigt som trycket på trånga platser minskas. Även om arbetet fokuserade på två trädgårdar kan tillvägagångssättet – att låta datorer sålla genom tusentals vardagliga bilder för att avslöja delade smakmönster – bidra till att skydda och levandegöra många kulturarvslanskap världen över.
Citering: Chai, H., Lu, S., Ni, L. et al. Semantic segmentation and spatial grid analysis of Chinese heritage landscape photographic compositions with cross-cultural perspectives. npj Herit. Sci. 14, 176 (2026). https://doi.org/10.1038/s40494-026-02439-1
Nyckelord: Kinesiska klassiska trädgårdar, turistfotografi, uppfattning av kulturarv, djupinlärning, tvärkulturella preferenser