Clear Sky Science · zh

维护学术诚信:一项关于利用 AI 辅助检测学生翻译中未经授权使用机器翻译的探索性研究

· 返回目录

这对学生和教师为何重要

随着在线翻译器和聊天机器人成为日常学习工具,教师越来越难判断一份学生作品是否真正反映学习者自身的能力。本文考察了一款写作分析程序是否能帮助教师发现语言课堂中隐藏的机器翻译使用,以及这对教育中的公平与信任意味着什么。

数字辅助工具在语言学习中的兴起

像谷歌翻译和大型聊天机器人这样的工具现在能在几秒钟内生成流畅且常常令人为之惊讶的译文。明智使用时,它们可支持阅读、听力,甚至写作练习。但当学生将这些输出悄悄粘贴到原本应展示其真实能力的作业中时,“聪明助力”与“作弊”之间的界限就变得模糊。作者将“未经授权”的使用定义为在未获许可或未按要求披露的情况下,将句子级或更长的来自这些工具的内容复制进书面作业。这很重要,因为它可能掩盖学生真实的能力,并削弱学术诚信所依赖的诚实与公平。

研究如何设计

为探索技术是否能帮助教师发现此类隐藏的辅助,研究者在一所中国大学进行了两阶段实验。首先,39 名具备中级至中上级英语水平的学习者完成了两项简短的中译英翻译任务。一个小组完全自行翻译,一个小组对谷歌翻译的输出进行后编辑,另一个小组对 ChatGPT 的输出进行后编辑。由此产生了三种条件下共 78 份学生译文。第二阶段,78 位英语教师被要求判断他们看到的每份样本是否受机器辅助,并记录他们依据的语言线索。半数教师在无任何辅助的情况下作出判断,另一半则获得了一份来自 ProWritingAid 的简要报告,该 AI 驱动工具概述了如语法准确性、典型句长以及连词使用频率等特征。

Figure 1
Figure 1.

AI 报告带来的变化

核心发现是,获得 AI 报告的教师在判断上准确率显著更高。平均来看,未得到辅助的教师正确率约为一半,而使用 ProWritingAid 的教师正确率约为四分之三。该工具并未直接告诉他们哪些文本受机器辅助;相反,它突出了写作中的可测量模式。例如,相较于教师对该组学习者的预期,部分译文表现出异常高的正确性、更复杂的措辞或更密集的连接词使用。该报告使得在多个样本间更容易看出这些对比,从而为教师提供了更坚实的怀疑或放心依据。

不同工具,不同痕迹

研究还发现,并非所有受机器辅助的文本都同样容易被发现。在本研究环境中,受 ChatGPT 影响的译文被识别得最频繁,谷歌翻译的结果最少被识别,而纯人工完成的作品则位于两者之间。一个可能的原因是,ChatGPT 的输出在词汇和行文流畅度上有时显得“对这个水平来说过于出色”,与典型学生作品形成鲜明对比。相比之下,经过轻度编辑的谷歌翻译输出可能更像中级学习者实际能产出的内容,从而更难与真实作品区分。研究者提醒,这些结果受特定任务、语言对和学生群体的限制,在其他情境中可能会有不同表现。

Figure 2
Figure 2.

教师真正依赖的线索

当教师解释其判断时,大多数人并未指出明显的错误,而是指出了看起来不合常理的优点:高级的用词、非常精炼的句子、强烈的连贯性以及几乎没有错误。典型的机器“失误”如奇怪的措辞或用词错误被提及得少得多。获得 AI 报告的教师在每次判断中引用的线索更多样,表明该工具促使他们交叉核查文本的多个方面,而不是依赖单一直觉。尽管这种更广的视角提升了整体准确性,但也带来风险:真正出色的学生作品可能仅因超出预期而被误判为可疑。

这对公平评估的含义

对领域外的读者来说,主要结论是:AI 确实可以帮助教师识别隐藏的机器翻译使用,但它并非魔法般的测谎器。即便在分析支持下,仍有部分真实作品被错误标记,部分机器辅助作品未被发现。作者认为,此类工具应当作为指导而非替代人工判断,任何“红旗”都应引导进行审慎复核,而非自动惩处。他们还呼吁在课堂上制定明确规则,说明何时以及如何使用翻译工具,并对教师与学生进行培训,帮助双方理解这些技术的优势与局限。以这种平衡的方式使用,AI 能支持更诚实、更透明的语言学习,而非与之对立。

引用: Zhou, X., Wang, X. Upholding academic integrity: an exploratory study of AI-assisted detection of unauthorised machine translation use in student translations. Humanit Soc Sci Commun 13, 331 (2026). https://doi.org/10.1057/s41599-026-06827-7

关键词: 学术诚信, 机器翻译, 语言评估, AI 写作分析, 翻译教学