Clear Sky Science · zh

基于XGBoost和BP神经网络的汉语经典英译可读性评估研究

2026-03-15 · 返回目录

为何古老智慧仍需清晰的英语表达

《论语》在两千多年间塑造了中国思想，但许多英语读者仍然觉得难以理解。不同的英译本在忠实原文与便于阅读之间做出不同权衡，但对于当代读者来说，哪些版本更容易理解并不明确。本文使用现代语言技术和机器学习来衡量几种《论语》英译本的可读性，提供一种以数据为依据的视角，来思考经典作品如何跨越语言与文化传播。

一本经典的多种声音

研究聚焦于五部完整的《论语》英译本，分别由詹姆斯·雷格（James Legge）、威廉·詹宁斯（William Jennings）、刘殿爵（D. C. Lau）、爱德华·斯林格兰（Edward Slingerland）和伯顿·沃森（Burton Watson）在19至21世纪译出。五位译者均以相同的文言原文为依据，但在风格与解释上各有取舍。为公平比较，作者将每个译本分割为1412行短句，粗略对应中文文本的传统语句划分。研究用三部译本训练模型，并保留两部译本以测试模型对新段落的判断能力。

把句子变成可测量的信号

研究者没有只依赖单一熟悉的公式（如弗莱施可读性指标），而是为语料中的每一行构建了多达114项更丰富的指标。其中一些是传统的可读性公式，衡量诸如句长和平均词长等基本特征；另一些捕捉词汇特征，例如长词或罕见词的数量、用词多样性和信息密度；第三类描述句子结构，例如从句数或某些语法模式的出现频率。最后，他们加入了现代方法：利用大型语言模型（BERT）估计每行在语料中语义上有多“典型”，从而提供一个简洁的意义层面连贯性指标。

教机器感知难度

利用这些指标，作者训练了两种机器学习模型——XGBoost模型和一个简单的反向传播神经网络——来预测每行的综合可读性分数。这些分数基于九种传统公式的组合输出，为模型提供了稳定的学习目标。在训练前，他们考察了各指标与分数之间的相关性。含有较多长词、多音节词或专业词汇的行通常被评为更难，字符总数更多和句子结构更复杂的行亦如此。相比之下，一些细粒度的语法计数仅起到了温和作用。两种模型在保留的数据上都能非常好地再现训练模式，表明这一特征组合在很大程度上捕捉了影响《论语》英译可读性的要素。

一目了然与细致比较译者差异

模型训练完成后，被用于评估斯林格兰和沃森的两部测试译本。在宏观层面，研究者将预测得分划分为从最易到最难的若干档，并统计每个译本各档中落入的行数。总体上，沃森的译文稍显更易读：他的更多行落在高可读性档中，而斯林格兰的译文更经常使用较长的句子和更精细的措辞。在更细致的层面，团队检视了两位译者差异明显的单句。在这些例子中，难句通常由多重因素叠加——更长的句子、嵌套从句、抽象或罕见词汇，以及将繁复评论压缩到单行中；而易读的句子则倾向于更短、更直接的表述和更简单的用词。

研究发现对读者与译者的意义

对于希望用英语接近孔子著作的一般读者，研究表明至少在纯粹阅读难度方面，某些译本比其他译本更为顺畅。对译者和学者而言，研究展示了定量工具如何补充传统的细读，通过在数千行文本中显现难度模式。作者强调，可读性只是优质翻译的一个方面；对原意与文学风格的忠实同样重要。不过，通过揭示句长、句法结构与用词如何塑造《论语》英译的阅读体验，这项工作有助于推动更易接近的中国古典版本，最终促进更清晰的跨文化对话。

引用: Yang, L., Zhou, G. Readability assessment of English translations of Chinese classics: a study based on XGBoost and BP neural networks. Humanit Soc Sci Commun 13, 588 (2026). https://doi.org/10.1057/s41599-026-06878-w

关键词: 文本可读性, 机器学习, 论语, 文学翻译, 自然语言处理