Clear Sky Science · zh

细化二语学习者对英语复合词加工动态的研究:一种心理语言学建模方法

· 返回目录

为什么二语中的词汇“解谜”很重要

当人们以第二语言阅读时,即便看起来很简单的词也可能隐藏复杂的心理加工。本研究探讨中国英语学习者在阅读完整句子时如何解读像“teapot(茶壶)”或“snowman(雪人)”这样的复合名词。通过追踪读者的眼动并结合计算模型,研究者展示了大脑最先依赖哪些线索——词的常见程度、词义从组成部分的清晰度以及构词方式——以及这些线索的组合如何从对一个词的首次注视到其意义最终被理解的瞬间发生转变。

通过注视窥见心智运作

为探查这一隐蔽过程,研究团队记录了40名中国大学高年级学生在阅读123个包含一个复合名词的英语句子时的眼动。眼睛的微小移动揭示了读者在每个词上停留的时长。作者关注三项指标:眼睛首次落在复合词上的时刻、对其的首次整体扫读时长,以及包括回读在内的总时长。这些阶段大致对应于字母串的早期识别、构建词的结构与部分词义,以及最终将该词整合进句子语义的过程。与此同时,每个复合词用十个数值特征来描述,捕捉该词及其构件在语言中出现的频率、总体词义与构件之间的清晰关联性,以及其构件的排列方式。

Figure 1. 中国学习者如何依赖词的常见程度与词义,逐步阅读英语复合名词。
Figure 1. 中国学习者如何依赖词的常见程度与词义,逐步阅读英语复合名词。

让数据驱动模型筛选线索

研究者没有仅依赖传统统计方法,而是采用监督式机器学习。他们训练了四类预测模型——决策树、随机森林、神经网络和支持向量回归——仅基于那十个词特征来估计读者在各阶段会在每个复合词上注视多长时间。通过比较这些模型的准确性以及它们最依赖的特征,团队可以推断出哪些语言线索在实时处理中最为重要。这一方法承认阅读并非简单的直线流程:不同因素可以以复杂的、非线性的方式相互作用,而这些相互作用往往难以用标准线性方程捕捉。

先快速猜测,随后深入求解

模型揭示出清晰的时间进程。早期阶段,整个复合词的总体频率占主导:常见词被快速识别,导致首次注视时长较短。当复合词罕见时,读者似乎依赖其组成部分,尤其是第一个成分,这暗示他们尝试将词拆解为熟悉的构件。在中期阶段,随着读者继续注视该复合词,频率仍然重要,但第二个成分的词义——通常定义复合词所指事物类别的“中心”——变得更为关键。到晚期,即考虑总阅读时长时,与词义相关的度量开始与频率的影响相当。那些整体词义与其构件意义高度一致的复合词,比那些从构件难以推测其意义的透明度低的词更容易被快速理解。

Figure 2. 词频与词义的影响如何在复合名词阅读的早期、中期与晚期阶段发生转变。
Figure 2. 词频与词义的影响如何在复合名词阅读的早期、中期与晚期阶段发生转变。

处理复杂词汇的灵活系统

综合眼动与建模结果,支持了这样一种对双语认知的描绘:它是灵活适应的,而非僵化的。中国学习者可以像母语者一样将常见复合词作为整体单元储存与检索。然而,当词不熟悉或其词义难以预测时,读者会切换到更慢的逐部分分析,权衡每个构件的熟悉度及其意义之间的契合度。作者将此描述为一种“多通路”系统,它并行尝试多条路径,并倾向于采用能最好促进理解的线索组合。对于教师和教材编写者而言,这提示二语学习者既受益于对常见复合词的重复暴露,也受益于帮助识别有意义词根或词缀的指导,从而更有信心应对新的词汇“谜题”。

引用: Peng, Y., Chen, S., Hou, R. et al. Refining the processing dynamics of English compound words in L2 learners: a psycholinguistic modeling approach. Humanit Soc Sci Commun 13, 672 (2026). https://doi.org/10.1057/s41599-026-06999-2

关键词: 复合词, 第二语言阅读, 眼动跟踪, 词频, 语义透明度