Clear Sky Science · zh

探索人工智能在文学自传翻译中的表现:AI模型与人工翻译的契合度有多高

· 返回目录

这对普通读者为何重要

我们大多数人现在都依赖在线翻译工具,有的人甚至使用AI来阅读用其他语言写成的小说或回忆录。但这些系统真的能捕捉到生命故事中的情感、节奏和文化深度吗?本研究考察了三种流行的AI系统与专业人工译者如何处理一部备受赞誉的中文文学自传,揭示了机器擅长之处、易出问题的环节,以及这对通过屏幕接触世界文学的读者意味着什么。

Figure 1
Figure 1.

跨越语言的故事

研究者聚焦于《大江大河》(The Great Flowing River),这是一部广受好评的中文自传,将个人记忆与战时中国和战后台湾的动荡历史交织在一起。其英文版本由一组资深译者与作者密切合作多年完成,既保留了事实的准确性,又保持了克制、含蓄的情感风格。这一细致的人类翻译被视为基准。研究作者将三种AI输出与之对比:谷歌翻译的神经机翻系统、一款通用大型语言模型(ChatGPT-4o)以及一款侧重推理的新模型(OpenAI-o1)。所有系统都在日常默认设置下被要求将相同章节从中文翻译成英文,模拟典型用户的使用情境。

窥看语言的内部机制

为了超越对“好”或“差”翻译的直觉判断,研究使用了一种名为Coh-Metrix的工具来测量英文文本的一百多项特征。这些特征既有简单计数——比如动词或形容词的出现频率——也有更微妙的属性,如句子之间的衔接紧密度、措辞的具体性以及段落易读性。作者将这些度量分为六大类:词汇选择、句子结构、想法之间的显性连接、更深层的概念关联、表面特征(如句长)以及整体可读性。通过在这些维度上比较得分,研究可以以量化方式展示每种AI的风格和结构与人工翻译之间的相似程度。

Figure 2
Figure 2.

不同AI的表现特征

三种AI系统呈现出各自不同的“个性”。谷歌翻译倾向于使用更常见的词汇和相对简单的句子,使输出更易读,但更缺乏丰富性和与叙述者个人声音的关联。它较少使用第一人称复数代词如“we”和生动的动词,这削弱了自传中共同经历感的重要性。相比之下,两款大型语言模型更偏好使用更多的形容词和副词以及更广泛的词汇。它们的措辞可能显得更为华丽和动态,有时会加入人工译者并未着重的描写性细节。这在某些地方有助于增强清晰度,但也可能破坏原作的克制基调,尤其是在作品以收敛而非铺陈为力量来源的段落中。

深度、连贯性与情感潜流

就句子与段落之间的思想如何衔接而言,没有任何AI系统能完全达到人工译者的水平。人工译本持续使用重复名词、精心选择的连接词以及清晰的因果线索,帮助读者跟随复杂的事件和情感转折。AI往往较少依赖这些显式标示。同时,它们有时会过度强调动作与因果,使用大量因果或意向性动词,使情境更为直白,但也更趋字面化。侧重推理的模型OpenAI-o1尤其容易推断出额外细节——例如补上政治人物的全名或将“处境变化”演绎为“危机”。这些推断会使叙述看起来更直接,但也可能偏离作者原本的写法。

哪种AI最像人类

在众多测量维度上,ChatGPT-4o最接近人工译者的特征。相较于谷歌翻译,它通常提供更丰富的词汇和更具语境意识的措辞,同时避免了OpenAI-o1的一些激进解释性扩展。谷歌翻译虽不够细腻,却常在表面措辞上更为忠实并产出非常可读的文本,尤其适合非专业读者。尽管OpenAI-o1旨在“更深入思考”,在该特定任务中总体上与人工译本的契合度最差。其推理能力常使其以重构或扩展某些表达的方式介入,可能在风格或文化准确性上不符合文学文本的要求。

对读者与译者的含义

对普通读者来说,结论是:当下的AI已能生成流畅且有时令人印象深刻的文学自传译文——但在保持作者声音、细腻情感和文化微妙之处方面,仍不及人工专家。在本次测试的系统中,ChatGPT-4o目前最接近专业水准,谷歌翻译在实用可读性上也不落后太远。侧重推理的模型在这一任务中表现较弱。然而,人工译者仍不可或缺:他们能够兼顾历史、文化与文体,从而构建出连贯且情感层次丰富的叙述,这是机器只能部分复制的。随着AI工具不断改进,本研究表明它们更应被视为强大的辅助工具,而非文学译者的替代品,仍需人类判断来将生命故事完整地跨越语言传达出来。

引用: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4

关键词: 文学翻译, 机器翻译, 大型语言模型, 中文自传, 人工智能与人工译者