Clear Sky Science · zh
面向重建清宫内饰的一种批判性人工智能生成内容方法:以圈寝斋为例
这不仅关乎宫墙之外的事
人工智能在创造从未存在之地的图像方面变得异常出色。但它能否被信赖去忠实重现确实存在且具有深厚文化意义的场所?本文审视了位于北京故宫内的一座知名建筑,探讨当今的图像生成 AI 工具能否在不悄然扭曲历史的前提下,帮助我们进行此类室内的数字重建。
故宫的一颗隐秘瑰宝
圈寝斋,即“勤政疲劳斋”,是藏于故宫宁寿宫花园内的一处精致退隐空间。为乾隆皇帝建造于清代,其房间满载精巧工艺:雕花紫檀、竹丝镶嵌、镶玉家具、光泽绣屏,以及将平面转化为纵深山水的幻觉式壁画。由于圈寝斋得到细致保存,并在历史手册、图纸与修缮记录中有丰富记载,它提供了理想的测试场景:我们对其布局、比例与装饰逻辑有详尽认识,因此任何数字重建都可以与可靠档案进行核对。

把 AI 的想象力拿来检验
研究人员利用激光扫描和档案图纸构建了非常精确的圈寝斋三维计算机模型。该 SketchUp 模型兼具量尺与蓝图功能,捕捉了精确的房间尺寸、柱网、天花细节,甚至窗格的格栅样式。他们还建立了一套“语义”框架,说明每个空间的用途——静养或戏剧表演——哪些构件应当存在,装饰、颜色与象征如何支持这些功能。以此为基准,他们用两种流行的图像生成器 Midjourney 和 Stable Diffusion 为圈寝斋的两个主要分区(东侧的居住间和西侧的戏台间)生成了 200 多幅图像。
AI 在宫内出错的地方
乍看之下,许多 AI 生成的室内图像显得惊艳且“具有中国风”,充满雕花木作、鲜亮色彩与华丽天花。但当团队将其与参考模型比对时,一些一致性的失真就显现出来:纵深被夸大约达 40%,水平尺寸被压缩,上层略显扁平,若干装饰构件——如藻井与走廊屏风——被放大到超出真实尺度。换言之,AI 倾向于追求戏剧化的视觉效果,而不是遵循实际结构的朴素秩序。第二层分析考察了文化意涵。在这里,模型往往堆砌过多纹样、提高色彩饱和度或模糊不同时期与地域风格之间的界限,生成一种泛化的“东方宫殿”意象,而不是遵循有关某些图案、色彩与陈设应置于何处的清代室内明确规范。

揭示潜在的文化偏见
这些模式化的错误并非单纯技术瑕疵。它们反映了全球视觉文化中长期存在的习惯:东亚空间常被描绘为异域、戏剧化的背景,而非受严格规制的精确建构。由于图像生成器从海量在线素材中学习——电影、游戏、旅游照片、奇幻艺术等——它们继承了这种偏见。研究表明,至少就圈寝斋而言,AI 更像是在再现一种全球性的“东方宫殿”幻想,而非重建有据可查的皇家房间。这使得当博物馆、设计师或公众将这些图像作为历史准确资料时存在风险。
与 AI 合作的新路径,而非替代
作者并不主张放弃 AI,而是提出了一个三阶段的“批判性生成”工作流程。首先,允许 AI 在经过精心结构化提示(包括功能、主要构件与历史时期)引导下自由探索氛围与变化的可能性。第二,专家将这些图像中最具价值的作品与测量模型与档案来源“校准”,修正比例、剔除时代错误的细节,并在装饰与结构之间重新平衡。第三,将校正后的成果导入专门的遗产建筑信息系统,嵌入关于材料、工艺传统与符号学的元数据。在此安排中,AI 成为快速的创意速写伙伴,但其想法始终由人的知识与证据加以核验与重塑。
这对数字遗产意味着什么
文章结论认为,当前图像生成 AI 在快速产出充满感染力的历史室内视图方面很有力,但作为独立重建工具则不可靠。若不受控,它倾向于放大奇观、缩小结构,并以可能误导观者的方式混淆文化信息。然而若以批判性方式使用——以精确测量与专家解读为锚——它可以加快早期设计和可视化工作,并帮助探索不同修复方案。对非专业人士而言,关键结论是:令人信服的图像并不等同于真实的图像,而在数字时代保存文化遗产将依赖历史学家、建筑师与这些协助描绘过去的机器之间的谨慎合作。
引用: Wei, C., Liu, J., Jia, J. et al. A critical Artificial Intelligence-generated content approach for the reconstruction of Qing Palace interiors: the case of Juanqinzhai. npj Herit. Sci. 14, 124 (2026). https://doi.org/10.1038/s40494-026-02390-1
关键词: 数字遗产, 故宫, AI 图像生成, 清代室内, 建筑重建