Clear Sky Science · zh
一种用于华山岩画图像修复的门控注意力多先验注入扩散模型
让古老的崖壁画重现生机
左江华山岩画位于中国南部,是一处跨越千年的壮阔崖壁画廊。今天,许多赭色的人物与符号已经严重褪色、开裂,甚至局部缺失。本文提出了一种数字方法,利用先进的图像生成技术对这些脆弱的艺术品进行虚拟修复,旨在在不接触岩体的前提下,支持细致的保护、研究与公众欣赏。

这些崖画为何重要
华山岩画沿陡峭的河岸崖面分布,以蹲坐的人像、祭祀场景和其他象征性图形为主,色调以鲜明的红色为特色。它是中国南方与东南亚地区规模最大、最为丰富的岩画群之一,也是壮族文化遗产的重要组成部分。但这些以富含铁的矿物为颜料的图像极易受雨水、风蚀、生物生长和人为接触的影响。几个世纪以来,这导致颜色褪落、轮廓破碎、剥落斑块和噪化的风化纹理,使得原本的图案难以辨认。传统的人工修复既缓慢又有主观性,且难以复制,使得在大范围内保护这一脆弱遗址变得异常困难。
智能修复可以如何提供帮助
数字图像修复提供了一种“虚拟填补”缺损的途径,遵循最小干预的保护原则。与其在崖面上重新上色,不如让计算机推断缺失区域可能的形状与质感,从而产生一致、可逆的结果,这些结果可以存档为高分辨率资料,用于研究,并通过展览与沉浸式体验与公众分享。以往关于文化遗产的人工智能工作主要集中在损伤检测或图案分割,或用于修复形状与纹理更为规则的壁画。岩画提出了更大的挑战:其意义体现在细微的轮廓和象征性姿态上,而其表面高度风化且不规则。修复方法必须尊重原有形状,同时以可信但不过度臆造的方式完成粗糙、破损的纹理。
用于风化岩面的一套新数据集
作者首先构建了一个专门用于华山岩画修复的图像数据集。他们从印刷图集和公开网络来源收集了528张候选图像,经过严格筛选保留了177张,这些图像既清晰显示了岩画图案,又存在褪色、剥落和边界模糊等可见退化。所有入选图像被转换为统一的颜色格式并调整为512×512像素,主要绘画区域居中。为了以可控方式训练与测试修复方法,他们为每个样本生成三元组:(1) 干净的参考图像,(2) 将30–65%区域用黑色补丁遮蔽以模拟损坏的输入图像,(3) 指示缺失区域的掩码。该设置允许以像素级的客观指标评估不同方法重建底层艺术品的能力。

教会模型尊重形状与表面
论文的核心是一个基于扩散模型的修复框架,扩散模型是一类通过多步小幅去噪将噪声逐渐转化为图像的生成方法。作者没有将所有视觉线索混为一谈,而是将引导信息拆分为两个独立的“先验”:一个强调结构(边缘与笔触状轮廓),另一个强调纹理(细微颗粒与表面粗糙度)。这些先验从受损图像仍可见的部分通过确定性滤波器计算得到,然后编码为特征图。一个门控注意力融合模块在每一步去噪时决定应多大程度地信任结构或纹理引导,以及以多强的力度将它们注入扩散过程。早期系统更依赖稳定的轮廓;随着噪声减少,后期则更注重重建与周围岩面相匹配的纹理细节。
数字修复器的表现如何
研究团队在华山数据集上训练并测试其方法,并将其与从经典编码器—解码器网络到先进生成与状态空间方法在内的多种现有图像修复模型进行了比较。采用标准的误差、清晰度和结构相似性度量后,他们的模型在岩画测试集上实现了更低的像素级误差和更高的结构一致性,优于所有基线方法。消融实验表明每个新增组件——双分支先验提取与门控注意力融合——都带来了明显的提升。可视化比较显示对人物与符号轮廓的更平滑延续,以及修复区域与风化背景更自然的融合。注意力图也表明模型关注的是缺失边界、关键符号轮廓和纹理过渡带,而不是盲目重绘大面积区域。
这对保护过去意味着什么
对非专业读者而言,主要结论是该方法提供了一种更谨慎且可解释的数字修复手段。通过将形状与表面线索分离并随时间调整它们的影响,模型能够在重连破碎人物与填补缺损斑块的同时,保持原始崖壁的视觉与材质感。作者强调该系统是辅助而非替代专家判断,需要更多多样化数据与专家评估。不过,这项工作指向了一个前景:在不进行物理干预的情况下,濒危岩画可以以数字修复形式被记录、研究与分享,从而在保存视觉冲击力与文化内涵的同时延长其生命力。
引用: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7
关键词: 岩画修复, 文化遗产, 扩散模型, 图像修补, 华山绘画