Clear Sky Science · zh

3DSynBrush：一种用于单幅敦煌壁画的高质量三维重建框架

2026-03-13 · 返回目录

古代艺术与现代工具的相遇

中国西部的敦煌石窟保存着世界上最为杰出的佛教壁画之一，但这些脆弱的作品正日益褪色、开裂和剥落。本文提出了一种新方法，可以将一张壁画细节的单幅照片转换为栩栩如生的三维模型，帮助历史学家、保护人员和公众在不接触原作的情况下从各个角度探索这些艺术品。

濒临消失的宝藏

敦煌莫高窟常被称为“石头上的图书馆”，壁画记录了千年间的宗教故事、建筑、服饰、音乐和日常生活。时间、沙尘、盐分和人为活动都对其造成了损害，导致颜料褪色、灰泥剥落。传统保护依赖摄影记录和繁复的物理修复，但这些手段无法完全捕捉壁画的深度、色彩变化和空间感，也无法阻止继续的损失。相比之下，数字三维模型可以冻结时间片段，允许策展人分析细节、模拟光照，并在不危及原件的前提下广泛分享这些作品。

为何将平面绘画转为三维如此困难

创建令人信服的三维模型通常需要从物体周围不同视角拍摄的大量照片。然而，敦煌壁画是绘在洞窟墙壁上的平面画，通常对某个特定人物、动物或建筑纹样仅有一张高质量图像可用。艺术风格进一步增加了难度：笔触细腻、色彩因年代而暗淡、诸如细长绶带或光环等形状极为纤细。现有的三维算法大多在日常物体和建筑照片上训练，因此常常误解这些程式化的图像，产生变形的形状或捏造出破坏原作风格的细节。

一步步智能的数字画笔

作者提出了名为3DSynBrush的框架，巧妙串联了若干先进的图像与三维技术，每一部分解决问题的不同侧面。首先，他们构建了一个专门的中国壁画元素（CME）数据集：从高分辨率壁画照片中精心挑选并裁出的数千个人物、动物和植物元素。分割工具将每个元素从复杂背景中干净地分离出来，留下保留边缘和细小结构的透明轮廓。接着，一个透视合成模块基于强大的“扩散”模型，凭借从大规模训练集中学到的典型三维关系，想象出该单幅人物从若干标准视角的样子。即便只提供了单张原图，这一过程也能生成围绕该元素的一系列一致视图。

从想象的视图到实体形状

这些合成视图随后被送入神经渲染系统，拼接成连续的三维“光场”，本质上是对元素周围每一点光与颜色行为的数学描述。该阶段针对壁画的柔和质感和非摄影风格进行了调优，在消除生成视图间小不一致的同时不抹去艺术特征。最后，网格构建模块将这一不可见的光场转换为由三角形组成的标准三维表面，自动在边缘和细节集中的区域进行精细化处理，并在平坦区域进行简化以减少点数。值得注意的是，生成的模型在点和面数量上仅约为现有领先方法的40%，但在形状和纹理上仍更接近原始图像。

对噪声、阴影和缺失具有鲁棒性

研究团队在模拟真实摄影的苛刻条件下测试了3DSynBrush：颗粒状图像、不均匀光照以及被阴暗部分遮挡的元素。即使在噪声和遮挡增加的情况下，主要三维形状仍保持稳定，表面纹理依然可辨。与若干顶级单图像三维方法在视觉和数值上的比较表明，3DSynBrush在重建壁画风格对象时更为干净、忠实，避免了常见错误如身体扭曲、表面破裂或纹理看起来像无关物体的现象。

让失去的世界重现生机

对非专业人士而言，关键结果是：一张敦煌的鹿、舞者或寺庙的单幅照片如今可以被转化为紧凑且精确的三维模型，供虚拟现实中浏览、用于数字展览或作为精细修复工作的参考。尽管系统仍依赖初始裁剪的质量并受限于当前图像分辨率，但它为保存脆弱壁画的外观和空间感提供了一条切实可行的路径。本质上，3DSynBrush如同一个尊重原作风格的数字雕塑家，将脆弱的壁画碎片转变为持久的、可交互的“雕像”，供后代研究与观赏。

引用: Peng, X., Wang, J., Hu, Q. et al. 3DSynBrush a high quality 3D reconstruction framework for single Dunhuang murals. npj Herit. Sci. 14, 154 (2026). https://doi.org/10.1038/s40494-026-02424-8

关键词: 敦煌壁画, 文化遗产数字化, 单图像三维重建, 神经渲染, 虚拟现实博物馆