Clear Sky Science · zh

通过知识引导的区域生长对佛像面部点云进行语义分割

· 返回目录

解读历史的面容

雕刻在悬崖与寺墙上的佛像不仅是精美的艺术品——它们是记录宗教信仰、艺术流行与跨世纪文化交流的三维档案。本研究展示了计算机科学家与文物专家如何通过自动地将眼、鼻、口等特征从密集的三维测量中分离出来来“读取”这些石面,即便没有可供学习的示例标签。目标是将沉默的石质转化为可量化的数据,帮助历史学家比较风格、追踪时代变迁,并为谨慎的保护工作提供依据。

为什么数字面容很重要

在敦煌、云冈、龙门等著名遗址中,佛像面部会因朝代与地域而呈现微妙差异——有的更丰腴,有的更纤长,有的眼神温和,有的鼻梁更挺。传统上,艺术史学家靠肉眼描述这些差异;如今,高精度的三维扫描将雕像表面捕捉为数百万个空间点。然而,这些“点云”很混乱:没有颜色或纹理,也没有内置的标记表明眼睛何处止于面颊何处。现有自动方法要么需要大量手工标注的训练样本,而这类遗产雕像的样本根本不存在;要么纯粹按几何特征划分表面,忽视了雕塑家真实遵循的造型规则。

Figure 1
Figure 1.

把面部规则教给算法

作者并不试图从稀缺数据中学习,而是以雕塑家自身使用的知识为起点。传统佛教手册描述了标准的面部比例,例如将面部分为上下三等(额、鼻、下颏),并让特征围绕中心轴保持对称。研究人员将这些文化与解剖学的经验转化为简单的几何规则:一条纵贯中线的对称平面;贯穿鼻中部的垂直线;以及描述眼、鼻、口、耳与下巴位置与尺寸关系的比例。这些规则并非僵硬的模板:它们包含可调参数,使得丰腴的唐式面容与更纤细的宋式面容都能在一个灵活但可识别的框架内被描述。

从种子点生长区域

在对三维扫描进行清理后,方法首先将佛面对齐为正面朝向,然后将表面投影到方格中,将三维形状转为类似阴影高度图的表示。在这个网格内,算法借助先验规则为每个面部特征挑选初始“种子”位置:鼻子种子位于中垂线附近且局部高点处,眼睛放在两侧对称的峰点,嘴巴位于鼻子下方的浅凹处,等等。从每个种子出发,计算机向外“生长”区域,仅在邻近单元的高度和坡度符合某一特征(例如鼻梁而非面颊)的预期时才将其纳入。随后进行额外步骤清理结果,修剪杂散部分、填补小空洞,并轻柔地平滑轮廓,使分割出的眼睛、嘴唇与下颏在计算机与人工专家看来都连续且可信。

方法测试

团队在十五尊佛面上测试了他们的方法——其中九个为受控形状的合成模型,六个为来自中国知名遗址的真实扫描。他们通过自动分割区域与专家手工描绘轮廓的重叠程度,以及计算边界与专家轮廓的匹配度来衡量质量。在眼睛、眉毛、耳朵、鼻子、嘴巴与下巴等部位,该方法取得了高得分,意味着大部分点被正确分配到相应特征。重要的是,结果在不同雕刻风格与表面风化程度下仍表现稳定。作者将其方法与一个仅使用少量标注示例训练的流行深度学习模型进行比较时,数据需求大的网络表现不佳,而基于知识引导的方法在无需大量训练集的情况下仍保持准确。

Figure 2
Figure 2.

对文物保护的意义

通过将雕塑家的传统测量规则编码进现代算法,本研究表明计算机能够在几乎不需手工标注的条件下对三维佛面进行分割,同时尊重原作的文化逻辑。对于历史学家,这为跨遗址与时期对面部风格进行系统化、定量化比较打开了大门;对于修复者,则提供了一种精确监测损伤或指导数字修复的方法。本质上,该方法将关于理想佛面数百年的约定转化为一把用于解读、保存与理解这些守护寺庙与石窟千余年的石面工具。

引用: Wei, S., Hou, M., Yang, S. et al. Semantic segmentation of Buddha facial point clouds through knowledge-guided region growing. npj Herit. Sci. 14, 109 (2026). https://doi.org/10.1038/s40494-026-02377-y

关键词: 佛像三维扫描, 文化遗产数字化, 点云分割, 艺术中的面部比例, 知识引导算法