Clear Sky Science · zh

使用带有分形梯度的快速残差收缩去噪网络对甲骨文进行修复

· 返回目录

将古老文字重新带入焦点

早在纸张与印刷出现之前,中国的占卜者就在龟甲和兽骨上刻写向神灵求问的文字。甲骨文是人类现存最古老的书面记录之一,但许多遗存都龟裂、磨损,难以辨认。本研究提出了一种新的计算方法,用以清理和锐化这些脆弱文物的数字图像,帮助历史学家和公众更清楚地看到其刻痕。

为何古骨难以辨认

甲骨经历了三千多年的风化、掩埋与搬动。学者们今天给它们拍照或拓印时,得到的图像常常包含斑点噪声、模糊和因骨质缺损而出现的缺失部分。笔画本身通常是较深的线条,但周围表面纹理稀少。为日常照片设计的常规消噪工具面对这种图像要么保留过多噪声,要么将古文字的边缘平滑掉——而恰恰这些边缘是专家最需要研究的部分。

一种更聪明的图像清理方法

为了解决这一问题,作者围绕甲骨的特殊视觉特征重新设计了图像“修复”流程。他们从成像中的一个常见观点出发:受损图像可被视为被模糊、噪声或像素缺失所扭曲的干净原图。从数学上讲,恢复原图是一个病态问题,存在许多可能解,因此需要额外的规则——称为正则化——来引导解向现实图像靠拢。团队采用了一种现代人工神经网络,使其通过预测应从图像中减去的内容来去除噪声,而不是从零重建整个图像。这种残差方法使训练更容易、更稳定。

Figure 1
Figure 1.

借鉴分形的模式

该方法的一项关键创新在于如何保护铭刻的清晰线条。作者没有依赖容易将噪声混淆为真实笔画的简单边缘检测器,而是采用了图像的“分形”视角。分形捕捉的是图案在不同尺度上的重复方式。算法通过在图像上滑动小窗口并统计该窗口内亮度随尺度变化的情况,构建出一张表明图像在何处结构复杂(通常沿着字形笔画)与何处平坦的地图。该分形梯度图成为训练目标的一部分:网络不仅被奖励使图像看起来更干净,还被鼓励保持这些多尺度的边缘结构完整。

通过巧妙的网络设计兼顾速度与细节

修复系统还通过可逆采样实现高效处理。首先,输入图像被分割为数个较小的、低分辨率的块,更易于网络快速处理。去噪后,借由上采样步骤将它们拼接回原始大小。在网络内部,小卷积滤波器层提取特征,同时一个软阈值模块决定哪些特征更可能是噪声并温和地收缩它们,而不是突兀地截断。这样的组合使模型在抑制斑点和模糊的同时,保留了携带书写意义的细微断笔和拐角。

Figure 2
Figure 2.

更清晰的字形,更快的结果

研究者在“虎”、“龙”和“犬”三种甲骨文字的图像上测试了他们的方法,模拟了三类常见问题:随机噪声、由镜头失焦引起的模糊以及需要填补的划痕或缺口。他们将该方法与一种知名深度学习方法 IRCNN 进行了比较,既做了视觉检验也用了常规的图像质量指标。在几乎所有情况下,新方法产生了更清晰、更连续的笔画,并在锐度与结构相似性评分上得分更高,同时运行时间也更短。对边缘图和梯度直方图的额外分析表明,它更忠实地再现了原始字形轮廓的方向和强度。

让古老书写呈现在现代视野

通俗地说,这项工作为世界上最古老的文字提供了一块更快速、更智能的数字“擦拭布”。通过将定制的神经网络与基于分形的边缘识别相结合,该技术可以去除噪声、恢复模糊并修补小缺口,而不会抹去专家所依赖的细微细节。随着此类工具的普及,它们有望使褪色的甲骨文——以及可能的其他脆弱铭刻——对学者、学生和博物馆参观者而言更易读,从而帮助保护并传播这一重要的人类遗产片段。

引用: Li, Z., Zhao, W. Restoration of oracle bone inscriptions using a fast residual shrinkage denoising network with fractal gradient. npj Herit. Sci. 14, 102 (2026). https://doi.org/10.1038/s40494-026-02361-6

关键词: 甲骨文, 图像修复, 深度学习, 文化遗产, 去噪