Clear Sky Science · zh
使用迁移学习与深度生成模型混合的自动图像修复用于历史文物修复
为什么用 AI 修复古代艺术很重要
世界各地的博物馆和考古学家都在与时间赛跑。经过数百年暴露在潮湿、污染和不当搬运下,古老的壁画、湿壁画和彩绘墙面在不断剥落、褪色和开裂。手工修复速度慢、费用高,有时甚至不可逆。这项研究提出了一种新的人工智能系统,能够对历史艺术品的损坏图像进行数字修复,为策展人和研究人员提供一种安全的方式来可视化丢失场景的可能面貌,并为后代保存这些作品。

开裂的墙面、缺失的颜料与数字安全网
传统修复通常意味着修复师对艺术品进行实物修补,在缺失处补上新颜料。即便谨慎操作,这些改变也不易撤销,且可能引入现代偏见。数字修复走的是另一条路:对受损壁画进行高分辨率拍摄,计算机算法提出如何填补缺失区域的建议。由于一切都在软件中进行,建议的修复方案可以比较、修改或完全放弃而不接触实物。作者聚焦中国敦煌的壁画——这个著名的石窟寺群的壁画长期遭受开裂、剥落、霉变和大面积缺损。他们的目标是构建一个能够自动修复此类图像的系统,同时尽可能保持原有的风格、色彩和细节。
从嘈杂照片到清晰起点
系统的第一步是清理输入照片,避免后续处理被相机噪声或光照不佳误导。该方法使用自适应中值滤波,这是一种能平滑去除斑点和随机的亮暗像素同时保留尖锐边缘(如壁画场景中的轮廓)的技术。然后增强对比度,使微弱的线条和褪色的颜色更易分辨。这些调整像是轻轻擦拭一只布满灰尘的镜头:它们不会创造新内容,但能让已有细节更加可见。通过谨慎调优此阶段,作者避免了过度平滑,这可能会抹去学者关心的精细笔触。
教系统识别损伤
图像清理完成后,模型必须判断壁画的哪些部分完好,哪些已损坏。为此,作者使用了一个紧凑但功能强大的神经网络 SqueezeNet,并加入注意力机制以使其专注于信息量大的区域。该网络学会解读壁画的视觉语言——灰泥的纹理、颜料的分布以及裂缝或裸墙的形状。其输出被送入另一个用于精确“切割”任务的网络 U-Net。U-Net 将每个像素标记为健康颜料、缺失补丁或其他劣化形式。得益于跳跃连接以及附加的注意力和残差模块,它能同时把握整体布局(例如人物或边框位置)与细小特征(如发丝和装饰),精确绘出需要修补的区域。

让 AI 画家填补空缺
在标出损坏区域后,最后阶段是想象这些区域原先的样子。作者在此结合了两种前沿思想:擅长生成逼真图像的生成对抗网络(GAN)与在捕捉长程关系方面表现突出的变换器网络。他们的混合“基于变换器的 GAN”会观察周围完整的颜料和整个壁画的全貌,以推断缺失区域的合理纹理、形状与颜色。它并非简单地复制邻近像素,而是综合生成新的内容,使其平滑地融入场景并尊重全局构图,比如图案的对称性或长袍与建筑线条的连续性。
数字修复器的表现如何
为测试系统,研究者使用了一个专门的敦煌壁画图像数据集,其中包含人工损坏的版本和真实原图。这样可以度量数字修复输出与未损坏参考之间的接近程度。他们报告称,所提出的方法 HDLIP-SHAR 在多项质量指标上优于若干强基线技术,包括总体清晰度(PSNR)、结构相似性(SSIM)以及更能反映人类视觉判断的现代感知度量(LPIPS)。该模型运行效率也较高,所需计算资源和时间少于许多对手方法,这对博物馆批量处理藏品很重要。
这对拯救历史意味着什么
对非专业人士来说,关键要点是该 AI 系统更像一位谨慎且可逆的助理,而不是一位自信过度的画家。它能提出如何完成古代壁画中缺失的面孔、图案或场景的建议,为学者提供强大的可视化工具,而不危及原件。同时,作者也指出了局限性:该方法仍依赖于有相对清晰的参考材料,对于极端严重的损坏效果不佳,且尚未将历史学研究或材质分析纳入其推断过程。即便如此,像 HDLIP-SHAR 这样的混合方法标志着将 AI 用于不仅仅是美化图像,而是以透明、可检验、非侵入的方式帮助维护不可替代文化遗产的重要一步。
引用: Swathi, B., Rao, D.B.J. Automated image inpainting for historical artifact restoration using hybridisation of transfer learning with deep generative models. Sci Rep 16, 4810 (2026). https://doi.org/10.1038/s41598-026-35056-w
关键词: 数字壁画修复, 图像修复, 深度学习, 文化遗产, GAN 与变换器模型