Clear Sky Science · zh

一种基于跨域去偏傅里叶融合与参数化坐标查询的简牍字形恢复方法

· 返回目录

让褪色的竹简文字重现生机

两千多年来,中国的官员、士兵与学者在薄竹片和木片上书写。如今,这些易碎的“简牍”承载着关于古代中国政治、贸易与日常生活的无价线索——但墨迹常被岁月、霉斑与损坏侵蚀难辨。本文提出了一种新的人工智能(AI)技术,能够对简牍上的单个字进行数字化恢复,帮助历史学家读取原本几近难以辨认的文本。

Figure 1
Figure 1.

为何古竹简如此难以辨认

与现代印刷页不同,竹简与木简表面有明显的纹理,纤维与污渍交错。我们关心的笔画往往细而淡,而背景纹理粗犷且不规则。对计算机而言,背景可能比书写更“响亮”。霉斑会平滑地使表面变暗,裂缝或缺失碎片则会完全抹去字形的一部分。常规的图像修复程序在普通照片上表现良好,但往往会模糊这些精细笔画、产生伪造纹理,或将背景噪声涂抹到字形应在的区域。

一种专注于重建缺失笔画的方法

许多修复方法尝试重建图像中的每一个像素,即便在完好无损的区域也是如此。作者则设计了一个将精力集中在损坏区域及其邻域的系统。首先,一个“参数生成”网络在降采样的损坏简牍图像与表示缺损位置的掩码上进行扫描,然后生成一组紧凑的指令——本质上是针对孔洞与附近上下文量身定制的配方。第二个“像素查询”网络使用该配方及损坏区域内每个像素的精确坐标,逐像素重建这些区域。因为网络始终精确知道自己在图像的哪个位置工作,它能更好地保留笔画边缘与连接等细节,即使在高分辨率下也是如此。

在不扭曲的前提下融合空间与波域信息

为理解并修复复杂纹理,该方法不仅依赖图像平面上的形状,还分析明暗变化在不同尺度上的分布,使用傅里叶变换——一种将图像表示为波的混合的数学工具。在简牍图像中,低频主要描述竹木背景,而高频则捕捉字形的锐利边缘。然而,若在波域中直接套用常见的神经网络技巧,可能会扰乱谱分布,导致奇怪的色块或背景纹理渗入笔画。因此,作者引入了一个“去偏”傅里叶模块,对谱进行重排与重新中心化,为每个频段附加可学习的位置标签,并对极端值进行温和归一化。与此同时,空间—频率融合块通过跨注意力机制让空间特征(局部形状与纹理)与频率特征(全局模式与噪声统计)相互引导,从而为损坏图像创造出更丰富、更稳定的描述。

Figure 2
Figure 2.

方法的测试与评估

研究团队汇集了来自多个朝代、规模超过6万张的单字简牍图像数据集,对其进行了严格的质量筛选并划分为训练集与测试集。他们还使用了既定的人为损伤掩码集合来模拟不同的缺损类型——小孔、大片缺失与随机裂纹状形状,并使用街景照片数据集检验方法在文化遗产材料之外的泛化能力。在大量测试中,新方法在重建缺失区域方面比七种主流修补技术更为准确,在像素精度、感知清晰度与结构相似性等指标上得分更高。可视化对比显示,恢复后的字形笔画更清晰、马赛克状伪影更少、以及来自背景纹理的污染更少,即便在霉斑或纤维纹理严重的情况下亦然。

对解读过去的意义

归根结底,这项工作提供了一个专门面向古代竹木文本的数字“修复师”。通过学习将脆弱的墨迹笔画与嘈杂、腐朽的背景区分开来——并谨慎管理空间形状与波状模式之间的相互作用——该方法能够以对人类专家看来合理的方式填补字形缺失,并辅助自动字符识别。尽管在非常大面积的缺损与某些复杂书写风格上仍存在挑战,该方法标志着将古简牍上微弱、断裂的痕迹转化为历史学家、语言学家及更广泛公众可读、可分析文本的一个重要进展。

引用: Lu, Z., Wang, T., Hu, X. et al. A JianDu character restoration method based on cross-domain debiased fourier fusion and parameterized coordinate query. npj Herit. Sci. 14, 159 (2026). https://doi.org/10.1038/s40494-026-02414-w

关键词: 竹简修复, 古汉字, 图像修补, 基于傅里叶的深度学习, 数字文化遗产