Clear Sky Science · zh
基于XGBoost和BP神经网络的汉语经典英译可读性评估研究
为何古老智慧仍需清晰的英语表达
《论语》在两千多年间塑造了中国思想,但许多英语读者仍然觉得难以理解。不同的英译本在忠实原文与便于阅读之间做出不同权衡,但对于当代读者来说,哪些版本更容易理解并不明确。本文使用现代语言技术和机器学习来衡量几种《论语》英译本的可读性,提供一种以数据为依据的视角,来思考经典作品如何跨越语言与文化传播。

一本经典的多种声音
研究聚焦于五部完整的《论语》英译本,分别由詹姆斯·雷格(James Legge)、威廉·詹宁斯(William Jennings)、刘殿爵(D. C. Lau)、爱德华·斯林格兰(Edward Slingerland)和伯顿·沃森(Burton Watson)在19至21世纪译出。五位译者均以相同的文言原文为依据,但在风格与解释上各有取舍。为公平比较,作者将每个译本分割为1412行短句,粗略对应中文文本的传统语句划分。研究用三部译本训练模型,并保留两部译本以测试模型对新段落的判断能力。
把句子变成可测量的信号
研究者没有只依赖单一熟悉的公式(如弗莱施可读性指标),而是为语料中的每一行构建了多达114项更丰富的指标。其中一些是传统的可读性公式,衡量诸如句长和平均词长等基本特征;另一些捕捉词汇特征,例如长词或罕见词的数量、用词多样性和信息密度;第三类描述句子结构,例如从句数或某些语法模式的出现频率。最后,他们加入了现代方法:利用大型语言模型(BERT)估计每行在语料中语义上有多“典型”,从而提供一个简洁的意义层面连贯性指标。
教机器感知难度
利用这些指标,作者训练了两种机器学习模型——XGBoost模型和一个简单的反向传播神经网络——来预测每行的综合可读性分数。这些分数基于九种传统公式的组合输出,为模型提供了稳定的学习目标。在训练前,他们考察了各指标与分数之间的相关性。含有较多长词、多音节词或专业词汇的行通常被评为更难,字符总数更多和句子结构更复杂的行亦如此。相比之下,一些细粒度的语法计数仅起到了温和作用。两种模型在保留的数据上都能非常好地再现训练模式,表明这一特征组合在很大程度上捕捉了影响《论语》英译可读性的要素。

一目了然与细致比较译者差异
模型训练完成后,被用于评估斯林格兰和沃森的两部测试译本。在宏观层面,研究者将预测得分划分为从最易到最难的若干档,并统计每个译本各档中落入的行数。总体上,沃森的译文稍显更易读:他的更多行落在高可读性档中,而斯林格兰的译文更经常使用较长的句子和更精细的措辞。在更细致的层面,团队检视了两位译者差异明显的单句。在这些例子中,难句通常由多重因素叠加——更长的句子、嵌套从句、抽象或罕见词汇,以及将繁复评论压缩到单行中;而易读的句子则倾向于更短、更直接的表述和更简单的用词。
研究发现对读者与译者的意义
对于希望用英语接近孔子著作的一般读者,研究表明至少在纯粹阅读难度方面,某些译本比其他译本更为顺畅。对译者和学者而言,研究展示了定量工具如何补充传统的细读,通过在数千行文本中显现难度模式。作者强调,可读性只是优质翻译的一个方面;对原意与文学风格的忠实同样重要。不过,通过揭示句长、句法结构与用词如何塑造《论语》英译的阅读体验,这项工作有助于推动更易接近的中国古典版本,最终促进更清晰的跨文化对话。
引用: Yang, L., Zhou, G. Readability assessment of English translations of Chinese classics: a study based on XGBoost and BP neural networks. Humanit Soc Sci Commun 13, 588 (2026). https://doi.org/10.1057/s41599-026-06878-w
关键词: 文本可读性, 机器学习, 论语, 文学翻译, 自然语言处理