Clear Sky Science · zh

一种基于众包图像的古建筑三维重建方法

· 返回目录

为什么假日照片能帮助拯救古建筑

世界各地的古庙、古塔和宫殿在风雨、污染与岁月中悄然消蚀。工程师们现在依赖精细的三维数字模型来监测裂缝、测量倾斜并规划谨慎的修复工作。但制作这些模型通常需要昂贵的激光扫描仪、无人机和现场团队。该研究展示了如何将一种更为平常的资源——游客在网上上传的大量照片——转化为对一座著名古木塔的高精度三维重建,既降低成本与风险,又改进了这处脆弱地标的数字记录。

把随手拍的照片变成可靠科学的难题

传统的三维测绘工具,如地面激光扫描器和装有相机的无人机,能以极高细节捕捉建筑,但代价高昂、受法规限制,且有时会遗漏复杂结构的部分。相比之下,众包图像数量充足、成本低廉且拍摄角度多样。问题在于这些照片质量参差不齐:有的模糊、曝光过度或被游客与树木遮挡;有的则由不同相机与镜头拍摄。当这些混合质量的图片被输入到常规重建软件时,形状与表面细节的误差会相互放大,产生扭曲的几何形态和模糊的纹理,这对于严肃的遗产保护来说是不可接受的。

Figure 1
Figure 1.

为杂乱现实图片设计的智能筛选器

为打破这一循环,作者设计了一个三步“智能筛选器”,在任何三维建模开始之前清理并组织数千张在线图片。首先,自动筛查阶段快速剔除明显无用的照片:检查照片中是否包含塔、分辨率是否足够、建筑是否并未被遮挡大半,以及图像是否没有被强光洗白或噪点淹没。每一步都使用了现代图像识别工具,并且一旦照片未通过某项检测即停止后续检查,从而节省大量计算时间。通过的图片随后进入第二阶段,通过比较整体内容与局部结构来发现几乎相同的近重复照片(拍摄时间仅相差片刻),仅保留最有用的版本。

以建筑“感受”的方式评估图像质量

即便经过筛选与去重,并非每张照片对重建精细雕刻、层叠屋檐和老化木梁都同样有帮助。因此框架的第三阶段从若干对三维建模重要的角度为每张图像打分:保留锐利边缘与轮廓的程度、纹理携带的视觉信息量、噪声或畸变程度,以及颜色与真实情况的接近度。作者没有依赖单一指标,而是融合了五种不同的质量指示器,并用统计方法学习每种指标与最终模型误差之间的关联强度。由此生成了一个平衡的“成绩单”,偏好既能保真形状又能呈现丰富可信表面的图像。

在一座倾斜木塔上检验该方法

研究团队将该框架应用于中国北方的应县木塔,这是一座有数百年历史、以复杂斗栱系统著称且有轻微但令人担忧倾斜的高耸木结构。他们收集了两组匹配的图像:一组是2015–2024年期间的众包照片,经过新的筛选与评分流水线处理;另一组则是作为传统基准的精心拍摄的高质量现场照片。两组图像随后被输入同一先进三维重建引擎,以便直接比较所得数字模型,从点云密度到表面锐度与颜色准确性。

Figure 2
Figure 2.

日常影像带来的更清晰虚拟遗产

经清洗与优化的众包图像不仅能与专业拍摄的照片匹敌——有时还更胜一筹。由筛选后在线图像构建的模型在建筑表面与体积内包含约多出四分之一的点,同时噪声和散点明显减少。雕刻牌匾与斗栱的边缘更为清晰,测得的纹理锐度提高近30%。与物理参考色卡的颜色差异下降了约三分之一,表明更接近塔的真实外观。对于遗产保护人员而言,这意味着在恰当的数字保障下,公众照片集合可以在无需重型设备或侵入性野外作业的情况下,提供高保真度的三维模型。

这对保护过去意味着什么

对于非专业读者,核心信息很简单:人们随手拍摄并分享的照片,如果经过恰当筛选与评估,可以成为保护世界建筑瑰宝的有力工具。本文的方法展示了如何在尊重历史建筑形状与表面的前提下,从杂乱的现实数据中区分出优质图像,生成详尽且值得信赖的三维模型。随着这些技术的推广,未来有望仅凭精心策划的众包照片就能多年追踪旧建筑的细微变化,使日常观光变成对文化保护的默默贡献。

引用: Liu, Y., Huo, L., Shen, W. et al. A method for 3D reconstruction of ancient buildings driven by crowdsourced images. npj Herit. Sci. 14, 81 (2026). https://doi.org/10.1038/s40494-026-02346-5

关键词: 三维重建, 众包图像, 文化遗产, 古代建筑, 数字保存