Clear Sky Science · sv

Modellering av visuell perception i kinesiska klassiska privata trädgårdar med bildanalys och tolkningsbar maskininlärning

· Tillbaka till index

Varför trädgårdsvyer fortfarande spelar roll idag

I många städer ligger historiska kinesiska trädgårdar nu intill höghus och motorvägar, ändå upplevs de ofta som lugna, rika och omsorgsfullt komponerade. Denna studie ställer en enkel fråga med moderna verktyg: vad är det egentligen i vyerna inne i dessa klassiska privata trädgårdar som får dem att kännas tydliga, fängslande eller ibland förvirrande för dagens besökare? Genom att omvandla trädgårdsfotografier till data och kombinera dem med människors reaktioner visar forskarna hur specifika visuella ingredienser och rumsliga layouter formar vår upplevelse — och hur gammalt designkunnande kan vägleda framtida gröna miljöer.

Figure 1
Figure 1.

Nogrann undersökning av klassiska Suzhou-trädgårdar

Teamet fokuserade på tre berömda privata trädgårdar i Suzhou, Kina, alla upptagna på världsarvslistan: Trädgården för odling, Canglang-paviljongen och Netmästarens trädgård. Trots liknande storlek hade varje trädgård olika tematiska betoningar — balans mellan berg och vatten, bergsbetonat eller vattenbetonat. Forskarna gick längs huvudstråken och tog, ungefär var tionde meter, ögonhöjdsbilder i fyra riktningar och byggde därigenom upp en uppsättning av 300 bilder som efterliknar vad en besökare faktiskt ser när hen rör sig genom rummet. Volontärer tittade sedan på dessa bilder online och bedömde hur varje scen upplevdes utifrån fyra enkla dimensioner: hur ordnad den verkade (koherens), hur lätt det skulle vara att hitta (läsbarhet), hur rik och varierad den såg ut (komplexitet) och hur mycket den inbjöd till utforskande (mysterium).

Att omvandla scenarier till siffror

För att koppla vad besökare ser till hur de känner använde författarna datorseende och artificiell intelligens för att tolka varje foto. En segmenteringsmodell identifierade nyckelelement — växter, stenar, byggnader, vatten och stigar — och mätte hur stor del av vyn varje element upptog. En annan modell uppskattade djup, och separerade förgrund från mellanground och bakgrund, medan färganalys fångade ljusstyrka, mättnad och blandningen av varma och svala toner. Textur summerades med ett fraktalt mått på visuell grovhet. Totalt extraherades 35 olika visuella indikatorer för varje bild. En maskininlärningsmodell lärde sig sedan hur kombinationer av dessa egenskaper förutsäger de fyra perceptionspoängen, och en tolkningsmetod (SHAP) visade vilka funktioner som betydde mest och hur deras effekter förändrades med ökande andelar.

Vad som gör en trädgårdsscen tydlig eller mystisk

Analysen visade att inte alla visuella ingredienser bidrar lika mycket. Byggnader, vatten, stenar, växter och stigar — särskilt andelen av vyn som upptas av arkitektur, gångytor och stenformationer — påverkade starkt om scener kändes koherenta och läsbara. Vatten och stenar tenderade att öka känslan av rikedom och mysterium, medan för mycket byggnadsfasader så småningom gjorde scener mindre komplexa och mer monotona. Färg och textur spelade mer subtila men viktiga roller: ett större färgomfång ökade upplevd komplexitet, och måttlig färgmättnad hjälpte människor att urskilja struktur i scenen utan att kollidera med trädgårdarnas traditionellt dämpade paletter. Avgörande var att många effekter var icke-linjära. Till exempel ökade en måttlig mängd vatten i vyn (runt 15% av scenen) mysteriekänslan avsevärt, men utöver det bidrog extra vatten föga. På samma sätt berikade viss förgrundsavskärmning och låga växter mysterium och djup, men när täta buskage fyllde mer än ungefär en tredjedel av vyn kände sig besökare mer vilse och mindre benägna att utforska.

Hur rumslig layout styr upplevelsen

Forskarna tittade sedan bortom enskilda snapshots för att se hur olika typer av utrymmen — vattensidor, bergsutsiktzoner och entrékorridorer — använde dessa visuella ”reglage” på distinkta sätt. I Netmästarens trädgård skapar en ring av byggnader och växter runt en central damm inåtriktade rum där vatten, måttlig byggnadsfront och växlande förgrundsavskärmningar kombineras för att ge höga betyg i koherens, läsbarhet och mysterium. I den bergscentrerade Canglang-paviljongen omsluter tät grönska många stigar och främjar fördjupning; noggrant placerade gläntor och något mer öppna gångar fungerar som visuella ”utsläppspunkter” som återställer orientering och öppnar vyer. Entrékorridorer kantade av arkitektur och tydlig beläggning ger några av de högsta koherens- och läsbarhetspoängen, och fungerar som visuella trattar som förbereder besökare för mer intrikata scener längre in i trädgården. Icke-korridorentréer uppnår något liknande genom att flankera en central stig med skugga och stenformationer, vilket smalnar synfältet samtidigt som det anas vad som ligger bortom.

Figure 2
Figure 2.

Gammalt trädgårdskunnande, nya designledtrådar

Sammantaget visar studien att den bestående charmen hos kinesiska klassiska privata trädgårdar inte är magi, utan en fint avvägd kontroll av visuell information. Formgivare balanserade historiskt mellan vad som visas och vad som döljs, hur mycket vatten eller arkitektur som framträder samtidigt, och hur tät förgrunden känns, så att varje faktor hålls inom intervall som stödjer både tydlighet och nyfikenhet. Genom att kvantifiera dessa intervall med modern bildanalys och maskininlärning ger författarna praktiska riktlinjer för att restaurera historiska trädgårdar och för att forma nya urbana gröna ytor som känns läsbara men ändå inbjudande. För vanliga besökare är budskapet enkelt: nöjet i att vandra genom dessa trädgårdar kommer från den omsorgsfulla rytmen av stigar, vyer och överraskningar som varsamt leder ögat — och sinnet — från ett ögonblick till nästa.

Citering: Huang, X., Li, H., Mei, Z. et al. Modeling visual perception of Chinese classical private gardens with image parsing and interpretable machine learning. npj Herit. Sci. 14, 105 (2026). https://doi.org/10.1038/s40494-026-02372-3

Nyckelord: Kinesiska klassiska trädgårdar, landskapsperception, visuella preferenser, maskininlärning, urbant kulturarv