Clear Sky Science · zh
一种改进的语义与草图双条件引导中国山水画图像修复模型
为脆弱杰作注入新的数字生命
古代中国山水画因其氤氲的山峦与流畅的笔意而备受珍视,但同样是极其脆弱的物件:数百年的搬运、虫蛀与潮湿会在画面上留下裂痕、虫孔和缺损。修复人员需要在保存现存部分与避免造成进一步损害之间取得平衡。本研究提出了一种专门用于这些画作的人工智能(AI)方法,旨在数字领域帮助修复缺损,在填补损失的同时保持画家原作的结构与风格。
为何古画需要新技术
传统中国山水大致分为两大传统:以巍峨峻拔群峰著称的北派,以及以淡墨晕染与留白见长的南派。二者都依赖于线条与色调的微妙变化,而这些在宣纸或绢帛退化时极易被破坏。人工修补耗时且不可逆:一句错误的笔触就可能永久地改变一幅名作。以往的数字技术要么简单复制邻近像素,要么依赖通用照片处理工具,它们或许能修补街景照片中的缺口,但在修复绘画时往往效果不佳,会生成生硬的岩石、不连贯的树干,或让专业人士感觉笔意“有违本分”。
新的 AI 如何学习结构与语义
为克服这些局限,作者设计了一个同时从三种互补视角观察画作的修复系统。首先,它提取出详尽的“草图”,显示每一道线条的力度——从粗犷的山脊到细微的质感笔触,采用针对保持细腻墨韵过渡而调优的边缘检测网络。其次,它构建一张颜色编码的语义图,标识每个区域的含义——天空、水、岩石、植被等,使用无监督语义分割模型完成。第三,它分析被部分遮挡的原始图像本身。这三条信息流被融合并输入到 Transformer 中(一种最初为语言任务发展起来的强大 AI 架构),由其预测缺失区域应如何呈现,以便既符合底层结构又契合整体场景。

教会 AI 模仿笔意,而不仅仅是形状
匹配构图只是挑战的一半;填补部分还必须贴合画家的笔触。因此团队增加了一个轻量的风格特征提取模块,聚焦于笔意与墨韵的细微特征——笔锋如何收、岩面纹理如何堆积、墨色如何在留白处渐淡。该模块从可见区域提炼出与风格相关的信息,并在系统重建缺损时分多阶段注入,引导输出朝向与原作相同的节奏与色调。训练采用复合目标函数,不仅惩罚像素级误差,还对结构感知、纹理统计与整体风格不匹配加以约束,促成在视觉上对人眼“看着对”的结果,而不只是对计算指标友好。

方法的检验
为评估该方法,研究者汇集了近 5,000 幅来自公共博物馆收藏与公开基准的高质量山水画数据集,平衡了北派与南派作品。研究团队在数字上施加模拟真实损伤的不规则遮罩——小缺损、宽幅擦痕与成簇的虫孔——并将其方法与六种领先的修复系统进行比较,包括广泛使用的卷积网络、Transformer 模型与现代扩散模型。在多种损伤程度下,新模型在清晰度、结构相似性与视觉真实感等指标上持续取得更高分数。放大比对显示更顺畅的山脊轮廓、更可信的树枝,以及与未受损区域无缝融合的墨色纹理。包括受训画家在内的人工评审也更偏好其修复结果,认为在结构与风格上更为连贯。
这对文化遗产意味着什么
简而言之,这项研究表明,AI 系统可以被训练为不仅“填补图像空缺”,还能尊重中国传统山水画的内在逻辑与个性。通过结合线稿、区域语义与风格线索,模型能够重建出看起来仿佛原卷中本就存在的缺失部分。虽然它不能取代修复师,但为博物馆与研究人员提供了一个强大且无损的工具,用于可视化可能的修复方案、规划修复工作、以及创建更完整的数字替代品——帮助这些山水在纸张过于脆弱无法展开之后仍得以保存与研究。
引用: Cao, S., Mu, D., Zhang, Y. et al. An improved semantic and sketch biconditional guided image inpainting model for Chinese landscape painting. npj Herit. Sci. 14, 103 (2026). https://doi.org/10.1038/s40494-026-02371-4
关键词: 数字修复, 中国山水画, 图像修复, 文化遗产, 艺术保护