Clear Sky Science · zh
用于竹简文字图像的双流解耦超分辨率
让褪色的竹简文字重现生机
几个世纪以来,中国的官员与学者在细长的竹简和木简上记载律令、书信与思想。如今,许多这些古老记录仅以脆弱、变暗的片段存世,墨迹模糊、表面龟裂。历史学家与修复人员依赖这些简牍的数字图像,但文字常常模糊不清,难以辨认或修复。本研究提出了一种新的成像方法,在尊重原始材料的前提下锐化字符,为早期中国史料打开更清晰的观察窗口。
为什么旧竹简难以辨认
竹简与木简属于有机材料,经年累月不免受损。受潮、霉变与物理应力会导致纤维磨损、墨迹扩散与表面污渍。即便使用高质量相机或红外成像,所得图像仍可能出现笔画晕开、纹理噪声与细节缺失。简单的数字处理手段如放大或平滑往往会进一步模糊笔画边缘。现有用于文本锐化的人工智能方法大多在街道标牌或日常场景的印刷文字上训练,而非脆弱、竖写在老旧竹简上的书法。因此,这些方法常常将重要笔形平滑掉,或生成误导性的结构。

将文字与背景分成两条路径的方案
研究人员提出了一个名为 DSF-SRFormer 的图像重建模型,将书写和竹简表面视为两个不同但相关的问题来处理。系统并非把所有内容放进同一组特征,而是先分离出属于文字的部分与属于背景的部分。一条路径专注于墨色笔画,另一条路径则关注较浅的纤维、污渍与简面的纹理。在文字路径中,特殊模块会关注中国书法中常见的主要笔向——横、竖与斜笔——从而在笔画弯折、交叉或收锋处加强正确的笔形。背景路径则在多尺度上工作,理解既有细小纤维也有较大污渍,从而在清理噪声的同时不抹除有意义的痕迹。
处理纵向长条的书写布局
除了单个字符,完整的竹简通常呈现出延续很长距离的竖列文字。为应对这种版式,作者设计了一种“长条”注意力机制,将每张图像切分为重叠的竖向带状区域。在每个带内,模型学习笔画如何沿行延续并跨列联系,然后将相邻带轻柔融合,使字符在整片简上保持一致。该设计捕捉到长程关系——例如某一部分笔画与更下方笔画之间的关联——同时保持计算的可控性。通过在字符级与整简级别同时重建,方法旨在生成对人类专家而言更清晰、更易读的图像。
衡量更清晰的笔画与更干净的表面
为训练与测试系统,团队收集了大量来自竹简、丝帛手稿与手写草稿的字符图像,并生成模拟真实损伤的数字化破坏,模拟纤维纹理、墨迹扩散、陈旧斑点及其它缺陷。他们还准备了源自已出土文本的整简图像。在训练过程中,模型的目标不仅是匹配原始像素,还要保持边缘清晰与整体观感悦目。作者将 DSF-SRFormer 与多种既有的锐化方法对比,从经典插值到先进的深度学习与扩散模型。在若干测试集上、对中等与强烈放大倍率,本模型在保真度与视觉质量评分上持续领先,视觉样例显示笔画更连贯、干扰性伪影更少。

从数字清理到历史解读
研究结果表明,谨慎地将文字与承载材料分离,并针对竹简独特的版式定制处理流程,能比把一切视为通用图像获得更清晰的重建效果。尽管该方法仍有局限——例如处理极不均的文字尺寸或超出红外图像范围的情况——它已能显著提升难读资料的可辨认度,并在现代街道文字基准上表现出竞争力。对于历史学家、考古学家和修复专家而言,这意味着能获得更清晰的古文献数字影像,更容易识别字符、修复缺损并解读来自中国早期的长久沉默的声音。
引用: Wang, W., Wang, T., Hu, X. et al. Dual-stream disentangled super-resolution for bamboo slip text images. npj Herit. Sci. 14, 229 (2026). https://doi.org/10.1038/s40494-026-02495-7
关键词: 竹简, 古代手稿, 图像超分辨率, 数字修复, 中国书法