Clear Sky Science · zh

利用生成对抗网络的人机协同方法破解甲骨文铭刻

· 返回目录

古老文字与现代机器的相遇

三千多年前,中国的占卜者在龟甲和兽骨上刻下关于战争、天气和收成的问题。如今,这些甲骨铭刻是理解汉字与早期中国社会如何形成的重要宝库。但许多小而风化的符号仍未被破译,数量庞大,少数专家难以独力应对。本文展示了人工智能如何与学者携手,通过将这些古老刻痕转化为现代汉字风格,帮助识读甲骨文。

从骨上的图像到计算机可读的图像

甲骨文具有显著的视觉特征。早期刻写者直接在骨上雕刻老虎、太阳、人物和工具等简化图像,因此每个字几乎像一幅小画。作者利用这一点,把每个字视为图像而非代码或文本。他们收集了一千多对图像:一侧是拍摄的甲骨字形,另一侧是其已知的现代汉字对应。通过调整尺寸和清理这些图像,构建了一个标准化的图像库,供计算机学习,从而把古老的破译问题转为现代的图像到图像翻译任务。

Figure 1
Figure 1.

两位数字艺术家:互补的 AI 模型

团队训练了两种相近但不同的生成对抗网络(GANs),这类模型通过让“生成器”与“判别器”对抗学习生成逼真图像。一种基于名为 Pix2Pix 的系统,利用成对示例学习:它看到甲骨字形以及应当转换成的精确现代字形。这一模型擅长生成清晰、形态良好的现代风格字形,与预期形状高度吻合。第二种基于 CycleGAN,设计用于在示例并非完全配对时也能工作。它倾向于保留甲骨文字的原始骨架与风格,同时将其轻微规则化为现代形式。两者合用,为对受损或模糊字形作出更规则、更可读的多种“解读”提供了不同视角。

对机器的测试与方法比较

为了验证这些系统是否不仅仅在绘制好看的图像,作者进行了严谨的测试。他们预留了160对已知的甲骨—现代配对,训练时不让 AI 看到这些样例,然后让每个模型从甲骨图像预测现代字形。作者用标准图像质量和结构度量将输出与真实答案比较,并进行视觉检查。在更广泛的比较中,他们让两种 GAN 与其他流行图像方法对比,包括扩散模型、变换器(transformers)和经典的 U-Net 风格网络。GAN 组合表现突出:Pix2Pix 生成最清晰、最易辨认的字形,而 CycleGAN 提供了保守且保留结构的替代方案。其他方法往往会模糊笔画、破坏字形骨架或生成不再像文字的形状,因此对严肃的破译工作帮助有限。

人类在环:协作而非替代

研究的核心不是单纯的人工智能,而是机器与专家之间的结构化合作。对于150个此前含义未知的铭刻,模型生成多种候选现代字形。人类专家随后从中挑选有前景的候选并手工重绘缺失或不确定的笔画,既参考 AI 的建议,又依赖他们对语言史和铭文本反映的日常生活场景的知识。在详细案例研究中——例如提出某个未知字形可能意为“洞穴”或“巢穴”——作者结合了 AI 建议的形状、与相关字形的比对以及关于古代居住与祭祀的历史资料。他们还在160个已知样例上做了对照实验,比较三种模式:仅 AI、专家从零描绘、以及专家修正 AI 草图。联合方法在数值图像评分与专家评判上均更接近真实字形,同时也为学者节省了时间与精力。

Figure 2
Figure 2.

对历史与遗产的重要性

对非专业读者而言,其意义清晰可见:每个新被破译的甲骨字都能使我们对早期中国历史的图景更为清晰,从皇家祭祀到农业与疾病。此项工作表明,人工智能不仅能识别现代笔迹或生成艺术作品;与细致的人类判断相结合时,它还能帮助打开书写文化最早的层面。该系统并非取代专家,而是作为一个智能助手提出形态建议、加速繁琐的重绘,并使整个过程更透明、可衡量。作者认为,这种人机合作模式可扩展到其他古文字与受损文献,把骨、泥、羊皮上的脆弱痕迹转化为关于古人生活、信仰与记录世界方式的可读故事。

引用: Zeng, S., Bai, J., Shi, J. et al. Human–computer collaborative approach to the decipherment of racle bone inscriptions with generative adversarial networks. npj Herit. Sci. 14, 232 (2026). https://doi.org/10.1038/s40494-026-02509-4

关键词: 甲骨文, 古代文字, 文化遗产与人工智能, 人机协作, 汉字演变