Clear Sky Science · zh
用于可见光-红外图像配准和竹简文字增强的自适应多特征融合
肉眼可见处隐藏的古代文本
两个多千年间,中国的公文、医书与日常记录多被写在细长的竹简和木简上。许多易碎的简牍保存于地下,但墨迹已经严重褪色,许多文字几乎看不见。本研究提出了一种新的成像方法,将普通可见光照片与相同简牍的红外图像对齐,然后在数字上恢复丢失的文字——使受损文本重新可读,为研究古代史打开更清晰的窗口。

为何古竹简如此难以辨认
出土的竹简与木简是无价的历史文献,但长久的埋藏使其龟裂、污渍斑斑、表面磨损。在可见光下,木纹、泥土与变色常常掩盖了已然微弱的墨迹,使字符模糊于背景或完全消失。红外相机能够显现可见光下不再可见的墨迹痕迹,因为墨水与木材在红外波段的反射差异。但红外图像通常缺乏策展人与史学家用来研究简牍制作工艺并拼接碎片所需的丰富色彩与表面细节。今天的研究人员常在可见光与红外图像之间反复切换,试图在脑中融合两者所见——这是一个缓慢且容易疲劳的过程,许多字符仍然不确定。
将两种视觉整合为清晰图像
团队通过精确对齐或“配准”每个竹简的可见光与红外图像来解决这一问题,从而将二者融合为一幅增强图像。这并非易事:由于两台相机与照明设置不同,图像可能存在平移、旋转、轻微缩放乃至畸变。此外,简牍纹理较弱——很少有明显的角点或图案——使得标准计算机视觉工具难以在两幅图像间找到匹配点。作者设计了一个多步配准流程,利用一个在波长间保持稳定的特征:每片简牍的外部轮廓形状。
从粗略对齐到像素级精确匹配
该方法从粗对齐阶段开始,将两幅图像缩小以抑制干扰细节,然后检测出简牍的长边轮廓以及少量类角点。因为竹简的轮廓在可见光与红外图像间变化甚微,这些边缘在估计图像应如何旋转、平移和缩放以对齐时被赋予高权重。接着进入全分辨率的精细对齐阶段。这里算法反复利用边缘轮廓与字符角点来细化配准,但有一个巧妙之处:在早期更信任大尺度的边缘;随着匹配改善,逐步增加围绕笔画的精确角点的权重。这种从“先轮廓”到“重细节”的自适应转变,有助于避免陷入糟糕解,同时仍能实现非常紧密的对齐。

让信息含量引导最终微调
即便几何匹配良好,可见光与红外图像的亮度模式也可能大相径庭。为完成最后调校,研究者加入了一步基于“互信息”的优化,互信息是一种衡量一幅图像预测另一幅图像灰度能力的统计量。算法对两视图之间的变换进行大量小幅试探性调整,并保留能最大提高共享信息量的改动。将一种全局探索方法(称为模拟退火)与更传统的基于梯度的精细化结合的混合搜索策略,使系统即便在图像有噪声或部分退化的情况下,也能收敛到既几何合理又信息丰富的变换。
让消逝的笔画复现生机
一旦可见光与红外图像被锁定在同一坐标系,框架的第二部分就聚焦于文字本身。对红外图像进行处理以增强墨迹与背景的对比,然后通过阈值分离出笔画区域。经过噪声与裂隙的清理后,提取出的书写被转换为透明的“墨迹掩码”。方法并非简单地将该掩码覆盖其上,而是采用一种基于差异的融合:实质上将墨迹模式从背景中减去,使那些可见图像中曾经有文字但现在只剩光秃木面的位置再次变暗。最后对色彩进行校正,在原先可辨的可见文字区域恢复自然的竹色。结果是一幅既保留简牍真实外观、色彩与质感,又让微弱与不可见的笔画清晰可见的单一图像。
为史学家与文物保护者带来更清晰的视野
在800多对竹简图像上的测试(包括许多文字严重受损的样本)表明,该新方法优于从经典特征匹配到现代深度学习方法在内的一系列现有配准技术。量化指标证实对齐图像共享更多信息且结构匹配更好,而可视化叠加显示可见光与红外内容几近完美重合。对历史学家与修复专家而言,这意味着他们可以从一幅增强图像中阅读并解释难辨的文本,加速转录并有助于拼接分散的碎片。更广泛地说,这项工作展示了如何结合多种成像方式与智能对齐和融合技术,将脆弱的书写从难以辨认的边缘拯救回来,强化了数字保存与研究世界文献遗产的努力。
引用: Wan, T., Qi, F., Yang, Y. et al. Adaptive multi-feature fusion for visible-infrared image registration and character enhancement of bamboo slips. npj Herit. Sci. 14, 96 (2026). https://doi.org/10.1038/s40494-026-02368-z
关键词: 竹简, 红外成像, 图像配准, 文字修复, 文化遗产