Clear Sky Science · zh

使用图像解析与可解释机器学习对中国古典私家园林视觉感知的建模

· 返回目录

为何园景视角在今天仍然重要

在许多城市中,历史悠久的中国园林如今坐落在高楼与高速公路旁,但它们仍然给人以宁静、丰盈且精心构成的感觉。本研究用现代工具提出一个简单问题:究竟是园内哪些景观使当代访客感到清晰、引人入胜或有时略显困惑?研究者将园林照片转化为数据,并将其与人们的反应配对,展示了哪些具体的视觉要素与空间布局塑造了我们的体验——以及古人的设计智慧如何为未来的绿色空间提供指引。

Figure 1
Figure 1.

聚焦苏州经典园林

研究团队聚焦苏州的三处著名私家园林,均列入世界遗产名录:耦园、沧浪亭与网师园。尽管面积相近,每处园林在主题上各有偏重——山水平衡、以山为主或以水为主。研究者沿主要路径行走,并大约每隔十米在视平高度朝四个方向拍摄照片,构建了模拟访客行进中实际所见的300张图像集合。志愿者随后在线查看这些图像,并沿四个简单维度对每个场景进行评分:场景的有序程度(连贯性)、是否容易辨认方向(可识别性/易读性)、视觉的丰富与多样程度(复杂性),以及场景对探索的吸引力(神秘感)。

将景观转化为数字

为将访客所见与其感受关联起来,作者使用计算机视觉与人工智能解析每张照片。分割模型识别关键要素——植物、假山、建筑、水体与道路——并测量每类要素占视野的比例。另一模型估计景深,将前景、中景与背景区分开来;颜色分析捕捉亮度、饱和度及冷暖色调的组合;纹理则用分形度量来总结视觉粗糙度。每张图像共提取了35项不同的视觉指标。随后,机器学习模型学习这些特征组合如何预测四项感知评分,解释方法(SHAP)则显示哪些特征最为重要以及它们随量值变化时效应如何改变。

是什么让园景显得清晰或神秘

分析表明,并非所有视觉要素的影响力相同。建筑、水体、假山、植被与路径——尤其是建筑立面、道路与假山占视野的比例——强烈影响场景是否被感知为连贯与易读。水与石往往提升丰富感与神秘感,而过多的建筑立面最终会使场景显得较为单调、复杂性下降。颜色与纹理起到较细腻但重要的作用:更宽的色彩范围提升感知复杂性,适度的色彩饱和度帮助人们识别场景结构,同时不过度冲突于园林传统的低调色彩。关键在于,许多效应呈非线性。例如,视野中适量的水(约占场景的15%)能显著增强神秘感,但超过该量后额外的水并无明显增益。类似地,适度的前景遮蔽与矮植被能增加神秘感与深度,但当密集灌木占据视野超过约三分之一时,访客会感觉更迷失、探索欲降低。

空间布局如何引导体验

研究者随后从单张快照退一步,考察不同类型空间——临水庭院、望山区与入口走廊——如何以不同方式使用这些视觉“旋钮”。在网师园,环绕中央池塘的建筑与植被形成向内的空间,水体、适度的建筑立面与变化的前景遮挡共同带来较高的连贯性、可识别性与神秘感评分。在以山为中心的沧浪亭,茂密的绿植包裹多条小径,增强沉浸感;精心布置的空地与略显开阔的路径作为视觉的“释放点”,恢复方向感并打开视野。由建筑与明确铺装围成的入口走廊通常给出较高的连贯性与可识别性,像视觉漏斗一样为访客准备进入更复杂的园内场景。非走廊型入口则通过在中心通道两侧设置荫蔽与假山实现类似效果,收窄视线同时暗示前方的景致。

Figure 2
Figure 2.

古老园理,新设计线索

总体而言,研究显示中国古典私家园林持久的魅力并非魔力,而是对视觉信息的精细调控。历代设计者在展现与隐藏、一次出现多少水或建筑、前景的密度等方面取得了平衡,将各项因素保持在既能支持清晰又能激发好奇的范围内。借助现代图像分析与机器学习将这些范围量化,作者为修复历史园林及塑造新的城市绿色空间提供了实用指南,使其既易于辨识又富有吸引力。对普通访客而言,结论很简单:漫步这些园林的愉悦源于路径、视野与惊喜的节奏性安排,它们缓缓引导视线——也引导思绪——从一个时刻走向下一个时刻。

引用: Huang, X., Li, H., Mei, Z. et al. Modeling visual perception of Chinese classical private gardens with image parsing and interpretable machine learning. npj Herit. Sci. 14, 105 (2026). https://doi.org/10.1038/s40494-026-02372-3

关键词: 中国古典园林, 景观感知, 视觉偏好, 机器学习, 城市遗产