Clear Sky Science · zh

对濒危文字数字化与应用的近期努力综述

· 返回目录

拯救消失书写的重要性

在世界各地,数以千计的社区使用独特的书写系统,承载着它们的历史、信仰与日常知识。其中许多文字如今已很少被书写或阅读,被全球性语言和现代技术挤压。本篇文章考察了计算机与设计工具如何不仅用于保存这些濒危文字的图像,还帮助它们在课堂、手机、游戏与艺术中重获新生。文章主张,真正的保护应从单纯将文字保存为数字档案,转向将其复振为人们生活的一部分。

Figure 1
Figure 1.

从活的传统到数字阴影

本文首先解释了什么使得一种文字成为濒危文字。与依赖语音和语法的口语不同,文字是用于书写该语言的可见符号系统。一个文字可能被多种语言共享,或者一门语言随时间改用其他文字。当日常使用逐渐消失时,文字就会变成濒危:它们可能只在宗教仪式、专业学术或装饰艺术中存续。年轻一代常常无法阅读,学校停止教学,现代计算机对其支持也很不到位。发生这种情况时,丢失的远不止拼写:一个社区组织知识的方式、与土地和精神生活的关系,乃至对世界的思考方式,常常与其书写形式如何塑造阅读与书写密切相关。

数字遗产与技术的承诺

将这些文字数字化是一个更大运动的一部分,称为数字遗产,利用相机、扫描仪、数据库和交互媒体来保护文化珍宝。早期努力主要集中在扫描物件并安全存储。今天,该领域更宏大也更具跨学科性:历史学家、计算机科学家、设计师和社区成员共同合作。对于濒危文字,这意味着超越对古手稿的拍照。它涉及对字符进行编码以便在任何设备上显示、设计字体和键盘、训练机器识别难辨的手写体,以及构建使社区能够书写、检索、翻译并重新混合自身遗产的工具。文章强调技术应由文化语境和社区优先事项来引导,而不是相反。

三阶段:让文字存续、活跃并付诸应用

为理解2011年至2025年间的120项最新研究,作者提出了他们称为“存续(Alive)、活跃(Active)与应用(Applied)”的三步路径。在“存续”阶段,工作集中于在数字世界中的基本生存:汇集扫描页的数据集、清理受损图像、教计算机识别字符、标准化字体并构建核心软件库。当前大多数研究都位于此处,反映出仅仅让稀有书写系统在屏幕上可见与可用所需的巨大努力。“活跃”阶段更进一步,使用语言技术来理解并连接意义。在此阶段,研究者构建将不同文字相互转换、翻译成主流语言、映射概念间关系并分析文字在文本与在线社群中使用方式的工具。这些项目将静态图像转化为可检索、可解释的知识。

Figure 2
Figure 2.

将文字带回人们的生活中

最后的“应用”阶段关注如何让濒危文字再次被儿童、家庭与更广泛的公众使用。此类研究开发了面向爪哇文、巽他文、萨萨克文与拜拜因文等文字的移动学习游戏,将记忆练习转化为趣味挑战。还有人构建在线平台供社区存储记忆、为日常书写设计输入系统,或使用虚拟现实创建沉浸式体验,让参观者探索仪式空间或妇女的书写传统。设计者在插图、动画与用户界面上进行实验,将文字编织进当代视觉文化。尽管这类工作仍属少数,但它直接支持代际学习、自豪感与日常使用——这些都是长期存续的关键要素。

走向复振,而非仅仅保护

纵览整个领域,作者指出了进展与不足。研究产出急剧增长,像生成式人工智能、迁移学习与少样本识别等新方法正帮助克服数据稀缺与脆弱的问题。然而大多数工具仍服务于专家而非社区,许多项目止步于技术演示,而未发展成成熟的公共应用。文章呼吁与原住民社区建立更紧密的伙伴关系,更关注情感联结与易用性,并加强设计、媒体艺术与叙事等创意学科的参与。直白地说,拯救一种文字不仅仅意味着把它安全地存入数字库;还要确保人们能够学习它、享受它,并将其适配到新媒体,从而让这些独特的观察与书写世界的方式继续生长。

引用: Shi, JQ., Tsung, F. & Zhang, K. A review of recent efforts in digitalization and application of endangered scripts. npj Herit. Sci. 14, 268 (2026). https://doi.org/10.1038/s40494-026-02522-7

关键词: 濒危书写系统, 数字遗产, 文字复振, 原住民语言, 计算语言学