Clear Sky Science · zh

用于东巴古文修复的三阶段渐进框架

· 返回目录

为何拯救古代图画文字重要

对于中国西南的纳西族人来说,东巴经是通向千年故事、仪式与日常生活的一扇门。这些书以一种罕见的图画式文字书写,将图像与词义融合在一起。时间、湿度和频繁触摸已使许多页受损,留下孔洞和缺失的笔画,使符号难以辨认甚至识别。本研究提出了一种新的数字化方法来“填补空白”,旨在恢复这些脆弱文本的形貌与含义,为文化保护提供一种强有力的新工具。

从破损页面到数字修复

修复专家长期以来尝试对受损手稿进行物理修复,但数字修复如今提供了另一条路径:无需触碰原件,计算机即可在扫描图像中重建缺失部分。对于普通印刷文字,现代算法已经能够根据周围形状和模式合理猜测缺失字母。东巴经的挑战更为复杂。每个符号都是一幅小图画,其线条既包含视觉风格也承载意义。如果软件仅仅为了使线条看起来平滑而随意完成笔画,就可能把符号改变为不存在的形态,从而扭曲文化记录。作者认为,任何严肃的修复工作都必须同时尊重艺术化的外观和书写体系的严格规则。

Figure 1
Figure 1.

从轮廓到含义的三步旅程

研究团队提出了一个专为严重受损东巴页设计的三阶段渐进框架,称为 TsP。第一阶段系统仅关注轮廓。它以受损图像为输入,检测笔画原先所在位置,并结合两种强有力的技术——擅长局部细节的卷积网络和擅长全局结构的 Transformer 网络——对缺失边缘进行粗略重建。得到的结果是一张近似的轮廓图,像素描一样即使在缺失处也能提示字符的整体形状。

让数字字典引导修复

在第二阶段,系统引入关于东巴本身的知识。研究人员建立了一个常用东巴符号的数字字典,为每个符号包含多种手写风格。算法将第一阶段修复得到的轮廓与字典中所有条目进行比对,找到最相似的完整字符。它并非读取文字标签,而是通过统计方式测量形状匹配的相似度。所选符号作为“内容先验”——对缺失字符的最佳猜测,提供语义线索和纯视觉方法难以捕捉的细微笔画细节。

润色最终图像

在第三个也是最终阶段,TsP 将两类信息结合:来自第一步的结构轮廓和来自字典的完整字符。一个专门设计的双分支神经网络从两种来源提取特征,一条分支关注笔画布局,另一条分支关注更丰富的内容模式。随后这些特征引导一个在图像空间和频域同时工作的修复模块,在频域中可以更有效地调整整体平滑度与笔画节奏等模式。最终步骤清理伪影、补全缺失笔画并平滑新旧生成区域之间的过渡,使修复后的字符自然地融入原始页面。

Figure 2
Figure 2.

效果如何?

为验证方法,作者使用了 DB1404——唯一的大型公开东巴字符数据集,包含以多种风格记录的数千个符号。他们制造了不同严重程度的数字“损伤”,掩盖每幅图像从小面积到一半不等的区域,使用不规则孔洞和划痕来模拟真实劣化。TsP 与领先的图像修复方法进行了比较,包括传统工具、基于 Transformer 的现代系统和扩散模型。在所有损伤程度下,TsP 生成的图像在视觉上更具说服力,在结构上也更接近原始字符——尤其是在大量缺失的情况下,这正是对稀有且脆弱手稿最为关键的场景。

对古文字的意义

简单来说,这项工作表明计算机不仅能把图像的裂痕抚平,还能在修复过程中尊重古老书写体系的规则和含义。通过先猜测受损字符的骨架,再将其匹配到已知符号,最后以两者为引导进行精细修补,TsP 更好地保留了东巴文字的原貌与语意。除去技术层面的成就,这一方法还能帮助图书馆员、历史学家和当地社区恢复可能无法辨读的手稿内容,并为全球其他濒危文字的修复提供范式。

引用: Bi, X., Shi, Q. & Chen, Z. Three-stage progressive framework for Dongba ancient texts inpainting. npj Herit. Sci. 14, 240 (2026). https://doi.org/10.1038/s40494-026-02524-5

关键词: 东巴手稿, 古文字修复, 图像修补, 文化遗产数字化, 深度学习