Clear Sky Science · zh

OBI 设计器:通过多模态风格迁移零样本生成甲骨文艺术字体

· 返回目录

让古老符号重获生机

三千多年前,中国人把向神明提问的文字刻在龟甲和兽骨上。他们使用的符号被称为甲骨文,是已知最古老的汉字形式,具有鲜明的象形美感。今天,艺术家和设计师希望将这些形状用于标志、海报、游戏和文化产品——但手工完成既缓慢又需要稀有的专业技能。本文介绍了一种名为 OBI-Designer 的人工智能系统,能够自动将这些古老符号转换为新的、有表现力的艺术作品,同时保持其可识别性并尊重其来源。

Figure 1
Figure 1.

这些古符号为何重要

甲骨文不仅是古老的文字;每个字往往是一个小图像,隐约暗示其含义——“火”如火焰,“马”如动物,“面部”用简化的人脸来表示。由于这种象形特性,它们成为现代视觉设计、书法和文化品牌的重要资源。但存在若干障碍:字符的数字化版本有限,难以支撑大型 AI 模型训练;若设计师过度改变形状,字符会失去历史真实性并变得难以辨认;“艺术感”是主观的,难以衡量或自动化。作者旨在同时解决这三大问题:他们希望构建一个数据需求低、保护可读性且仍允许大胆视觉创意的系统。

构建更好的数字字母表

第一步是创建更精确的甲骨文字数字版本。现有计算机字体通常仅用少数控制点描述每个字形,导致难以平滑地重塑。研究者对一款商业甲骨文字体进行了细致重处理,使每个字符由许多小曲线重建。自适应算法仅在最需要的地方添加额外点——例如尖锐角或弯曲处——而不会在简单区域增加冗余。其结果是一个新数据集,每个字符以可弯曲、可伸缩的轮廓形式存储,可以优雅地变形。这一几何基础使得 AI 系统能够以微妙、受控的方式改变形状,而不是随意扭曲。

从简单轮廓到智能形态

接着,OBI-Designer 重新塑造这些轮廓,以呼应所选词语或短语的含义。在第一阶段称为字形合成时,系统以基础字符和类似“狗的头部”的文本提示为输入。它将轮廓渲染为图像,送入强大的图像生成模型,并询问:“符合该短语的图像会是什么样?”系统并不允许模型完全自由地创造全新图像,而是利用模型的内部信号作为温和引导,推动原字符的控制点移动。额外规则像护栏一样约束过程:一条规则限制轮廓内部小三角形角度的变化,另一条保持字符的明暗大致格局。共同作用下,字形能获得新的、语义相关的特征——耳朵、尾巴或火焰——同时在结构上仍足够接近原有符号,便于识别为同一古文字。

绘出质感而不失笔线

第二阶段称为纹理合成,OBI-Designer 将关注点转向表面风格。它首先描摹精炼后的轮廓以捕捉关键笔迹和边缘。一个专门网络将该边缘图作为蓝图,确保生成的任何新图像都紧贴原始结构。在此之上,另一种轻量技术只微调图像模型的小片段,使其学会特定外观——比如剪纸、墨笔书法、木刻、霓虹光效或涂鸦——而无需重训整个系统。最终输出将清晰、忠实的线条与丰富多样的表面融合,为设计师提供一系列风格选项,这些风格都源自相同的历史根基。

Figure 2
Figure 2.

测试美感与清晰度

为了检验这些艺术作品是否仍能被“读作”甲骨文,作者将它们送入训练用于识别原始铭文的计算系统。该系统对 AI 生成字符的识别率接近 94%,仅略低于它对未经修改原件的准确率。有一定古文字知识的人工志愿者也将这些新字符评为优于若干竞品方法的结果,认为它们在结构完整性、语义贴合度和视觉吸引力上更佳。更多实验显示了一种微妙的平衡:添加更多几何控制点可以将设计推动向更具画面感的戏剧化形式,但过多控制点会降低机器的可读性。这一权衡为用户在清晰可读与艺术自由之间提供了明确的调节空间。

从古骨中创造新艺术

简而言之,OBI-Designer 是将人类最古老的书写符号之一转化为新颖现代艺术的智能助理。它尊重赋予甲骨文历史意义的核心形态,同时利用先进的图像模型提出新的形式与质感。作者强调,此类工具应明确标注其输出为 AI 生成,以避免与真实考古发现混淆。展望未来,同样的方法也可用于复兴其他古文字,为博物馆、教育机构和创作者提供一种通过不断演化的视觉设计来庆祝文化遗产的途径,而不是将其锁进档案。

引用: Zhang, J., Deng, F., Yuan, J. et al. OBI designer: zero-shot oracle bone inscription artistic characters generation with multimodal style transfer. npj Herit. Sci. 14, 152 (2026). https://doi.org/10.1038/s40494-026-02417-7

关键词: 甲骨文, 艺术文本生成, 文化遗产, 扩散模型, 字体风格化