Clear Sky Science · zh

书写体系中字形身份与变换的分层模型

· 返回目录

字形变化为何重要

每次阅读时,我们会本能地识别字母和符号,即便它们出现在不同的字体、手写风格或受损的铭文中。本文提出了一个看似简单却耐人寻味的问题:当符号的形状、发音或风格在数个世纪中发生变化时,什么使它仍被视为“同一”符号?作者提出了一个通用模型,用以描述任何书写系统中的符号,从古代雕刻到现代字母表,使历史学家和计算机都能使用。

剥开符号的多层面

为了解决这一难题,作者将符号描述为由多层构成,每一层捕捉我们阅读时所见与所理解的不同侧面。最底层是拓扑层,描述书写痕迹的原始几何形态:线条、曲线、角度以及它们如何连接。其上是视觉身份层,编码那些即使在精确形状变化时也能让我们识别符号的关键视觉特征。更高的层将这些视觉形态与语音、语言中的含义联系起来,最终到达诸如书法笔法或石刻凿痕之类的风格化表现。

Figure 1
Figure 1.
这五层——形状、视觉身份、声音、意义与风格——共同构成了描述书写系统及其变迁的单一框架。

从纸上的笔划到可识别的模式

拓扑层仔细考察字形(符号的书写形式)如何被分解为简单的笔划。该模型定义了一套基本操作工具——例如延长、缩短、旋转、镜像或平移一条线——可以逐步将一个字形变为另一个。通过将这些操作串联,作者展示了如何以逐步精确的方式描述历史上的形状变化。但仅靠几何并不能解释为何不同形状仍然被视为相同字母。这一功能由视觉身份层承担,它记录了组成部分的核心排列——比如类似“A”形状的一个尖端和两条支撑线——即使笔划长度或角度发生变化,这种核心排列仍保持不变。

把记号与语音和意义连接

一旦视觉身份确定,下一个层面就是语言领域。在语音层中,每一类视觉相关的字形都与一个或多个发音值相关联,这取决于书写系统。有些文字把一个符号映射到一个音,而另一些则允许单一符号根据语境表示多种发音。语义层则把相同的符号类与意义联系起来——无论符号表示整个词、词的有意义部分,还是仅表示需要与其他符号组合以形成词的音。这一结构让研究者能够描述同一基本记号如何随时间或在相关语言间改变发音或意义,同时不丢失其身份追踪。

风格作为文化指纹

最后的风格层捕捉文化、工具与材料如何影响书写外观,而不改变其底层结构、发音或意义。同一符号刻在石头上可能显得锋利而有棱角,用毛笔书写时则可能变得流畅而圆润。例如,中世纪欧洲的手稿在风格上展示了同一字母表的巨大差异,从紧凑的哥特体字母到挥洒自如的人文主义书体。该模型将这些视为位于稳定符号核心之上的表面变化。这有助于学者把书写系统的真正变革与由流行风尚、个人笔迹或从石刻到羊皮纸再到数字屏幕的媒介变化所致的差异区分开来。

Figure 2
Figure 2.

将模型应用于真实铭文

为了证明他们的分层方法不仅仅是理论,作者将其应用于若干案例研究。他们系统地通过所有五层分析了一段复杂的塞凯伊‑匈牙利罗瓦什铭文,从几何笔划到文化风格逐层推演。随后他们考察了两段来自古代阿拉伯的南闪文字铭文,其中一段只部分可解读,另一段已被完全破译。在每个案例中,该模型帮助将不同的字形归入共享的身份,关联到可能的发音与意义,并将风格性特征与更深层的结构性变化区分开来。这表明同一框架可以同时用于已知与未破译的文字。

对过去与未来的重要性

对普通读者而言,关键要点是:书写远不止一组字形。它是一个多层系统,几何、模式识别、语言与文化在其中相互作用。该多层模型为历史学家、语言学家与计算机科学家提供了共同的表述方式。它可以指导更智能工具的设计,用于读取受损文本、比较不相关的文字,或模拟书写系统如何演化。简而言之,文章展示了如何形式化我们在跨字体、时代与材料识别“字母”时的直觉——并将这种直觉转化为理解人类书写记录的蓝图。

引用: Pardede, R., Hosszú, G. & Kovács, F. A layered model for glyph identity and transformation in scripts. npj Herit. Sci. 14, 86 (2026). https://doi.org/10.1038/s40494-026-02351-8

关键词: 书写系统, 字形演化, 计算古文字学, 文字比较, 数字铭文学