Clear Sky Science · zh
在 Ngram Viewer 中提名儒学者:一种面向英语话语中儒学身份的数字人文学-文化语言学方法
这项研究为何对当代读者重要
当我们在线查询诸如儒学之类的概念时,往往信任那些显示词频和检索图表的工具。本文提出了一个简单却有力的问题:谁在掌控这些关于过去的图像,它们又在无声中对中国思想与身份传达了什么含义?通过追踪数百万本英文书籍中“Confucian”一词的使用,作者展示了数字工具如何在看似中立客观的外衣下放大文化偏见。
一个词如何变成文化标签
儒学身份最初指的是儒(Ru),一个延续已久的中国思想家、教师与制度传统。然而在现代英语中,“Confucian”常常被当作涵盖中国或东亚文化的笼统标签。早期关于谁可被视为儒学者的争论,因定义模糊与数据稀缺而举步维艰。本研究以大规模数字证据回应这些争论,论证在实践中,“Confucian”已越来越少是哲学范畴,反而作为一种由外部施加的族群文化标记被使用。
用大数据追踪词语的踪迹
作者结合了三种方法:数字人文、语料库语言学与批判性话语分析。他们使用建立在全球最大规模数字化书籍集合之上的 Google Books Ngram Viewer,观察与“Confucian”相关词汇在 1973 到 2022 年间的英文出版物中的出现情况。研究收集了 260 个邻近词与 214 个句法搭配词,并用专业软件对其意义进行分组。这种“双重三角验证”使得他们能够交叉检验数字模式、语言结构与历史解释,避免单一方法或数据集主导结论。

数字揭示的命名与意义
结果显示,“Confucian”与“Confucians”在英文语境中压倒性地占据了对儒的各类可能标签的主导地位,比如“Ruist”或“Confucianist”几乎不见踪影。换言之,一个由西方创造的术语已有效地成为全球标准。从“Confucian”在句中常见搭配词来看,该词与国家、朝代与时间段相关词强烈聚集,如“Chinese”、“Song”、“Ming”、“early”与“neo”。它也常与道教、佛教、基督教等其他哲学与宗教并列。相比之下,关于信仰、伦理或学习的日常用词则少得多,这表明该标签更以地域与历史为锚,而非思想或实践。
语言中深植的距离感与他者化
除了直接的词频,研究还考察了代词与人名如何构建发言者与被谈论者的关系。在所检视的英文书籍中,儒学者通常以“they”或“them”出现,而非“we”。文本将他们置于遥远的时空之中,常以朝代名或“early”“last”等描述来包裹。即便像梁漱溟这样受人尊崇的现代人物,也常被标为“the last Confucian”,仿佛这一传统已经终结。作者将这种模式称为一种“数据东方主义”,即数字系统和检索界面在不经意间引导读者把儒学视为一个异国的、古老的对象,而非一种由当代儒学者自我定义的活生生的身份。

重新思考我们对文化的数字镜像
对于非专业读者,核心信息是我们最信赖的文化数字镜像(如 Ngram Viewer 与 Google Books)并非仅仅反映世界;它们也在塑造世界。研究发现,通过全球英语书籍所呈现的现代儒学身份,主要被构造成一种中国或东亚的族裔与历史标签,从外部建构多于由当代儒学者自身构建。作者敦促读者和研究者以批判性的态度对待大型文化数据集,构建更为平衡的语料库,并更细致地关注《论语》等经典的阅读方式。如此一来,我们才能让数字工具成为促进跨文化理解的照明,而不是在无声中加固既有隔阂。
引用: Gui, X., Kaur, S. Nominating Confucian(s) in Ngram Viewer: a DH-CL approach to Confucian identity in Anglophone discourse. Humanit Soc Sci Commun 13, 736 (2026). https://doi.org/10.1057/s41599-026-07161-8
关键词: 儒学身份, 数字人文, Google Books, 文化偏见, 英语话语