Clear Sky Science · es
Refinando la dinámica del procesamiento de palabras compuestas en aprendices de L2: un enfoque de modelado psicolingüístico
Por qué importan los rompecabezas léxicos en una segunda lengua
Cuando las personas leen en una segunda lengua, incluso palabras aparentemente simples pueden esconder un trabajo mental complejo. Este estudio pregunta cómo los aprendices chinos de inglés deshilan sustantivos compuestos como “teapot” o “snowman” mientras leen oraciones completas. Al rastrear los movimientos oculares de los lectores y emplear modelos computacionales, los investigadores muestran en qué pistas se apoya primero el cerebro: cuán común es una palabra, cuán claro es su significado a partir de sus partes y cómo está construida, y cómo esta mezcla de pistas cambia desde la primera mirada a una palabra hasta el momento en que su significado finalmente encaja.
Observar los ojos para ver la mente en acción
Para asomarse a este proceso oculto, el equipo registró los movimientos oculares de 40 estudiantes universitarios avanzados en China mientras leían 123 oraciones en inglés, cada una con un sustantivo compuesto. Pequeños desplazamientos de los ojos revelan cuánto tiempo se detienen los lectores en cada palabra. Los autores se centraron en tres medidas: el primer instante en que los ojos aterrizan en el compuesto, el primer paso completo a través de él y el tiempo total invertido, incluida la relectura. Estas etapas se corresponden aproximadamente con el reconocimiento temprano de la cadena de letras, la construcción de la estructura de la palabra y el significado parcial, y finalmente la integración de la palabra en la oración. Al mismo tiempo, cada compuesto se describió mediante diez características numéricas que capturaban con qué frecuencia aparecen él y sus partes en la lengua, cuán claramente el significado global se relaciona con sus partes y cómo están ordenadas sus piezas.

Dejar que los modelos guiados por datos filtren las pistas
En lugar de usar solo estadísticas tradicionales, los investigadores recurrieron al aprendizaje supervisado de máquinas. Entrenaron cuatro tipos de modelos predictivos —árboles de decisión, bosques aleatorios, redes neuronales y regresión de vectores de soporte— para estimar cuánto tiempo fijarían los lectores la vista en cada compuesto en cada etapa, basándose únicamente en las diez características de la palabra. Al comparar la precisión de estos modelos y en qué características se apoyaban más, el equipo pudo inferir qué pistas lingüísticas importan más en tiempo real. Este enfoque abraza la idea de que la lectura no es un proceso lineal simple: distintos factores pueden interactuar de manera compleja y no lineal, difícil de captar con ecuaciones lineales estándar.
Primera conjetura rápida, luego significado más profundo
Los modelos revelaron una cronología clara. Al principio, la frecuencia global del compuesto dominaba con fuerza: las palabras comunes se reconocían con rapidez, lo que llevaba a fijaciones iniciales más cortas. Cuando el compuesto era raro, los lectores parecía que recurrían a sus partes, especialmente a la primera, lo que sugiere que intentan descomponer la palabra en bloques familiares. En la etapa intermedia, a medida que los lectores seguían mirando el compuesto, la frecuencia aún importaba, pero el significado de la segunda parte —la cabeza que a menudo define qué tipo de cosa es el compuesto— adquiría más relevancia. En la etapa tardía, cuando se consideraba el tiempo total de lectura, las medidas relacionadas con el significado rivalizaban con la frecuencia en influencia. Los compuestos cuyo significado global coincidía estrechamente con los significados de sus partes se resolvían más rápido que los opacos, cuyos significados no se podían inferir fácilmente a partir de sus componentes.

Un sistema flexible para manejar palabras complejas
En conjunto, los resultados del seguimiento ocular y del modelado apoyan la imagen de una mente bilingüe adaptable en lugar de rígida. Los aprendices chinos de inglés pueden almacenar y recuperar compuestos frecuentes como unidades integradas, de forma similar a los hablantes nativos. Sin embargo, cuando las palabras son desconocidas o sus significados son difíciles de predecir, los lectores cambian a un análisis más lento, parte por parte, valorando cuán familiar es cada componente y cómo encajan sus significados. Los autores describen esto como un sistema de “múltiples rutas” que prueba varias vías en paralelo y tiende hacia la combinación de pistas que ofrece la mejor posibilidad de comprensión. Para profesores y autores de libros de texto, esto sugiere que los aprendices de una segunda lengua se benefician tanto de la exposición repetida a compuestos comunes como de la orientación para identificar partes significativas de las palabras, ayudándoles a afrontar nuevos rompecabezas léxicos con mayor confianza.
Cita: Peng, Y., Chen, S., Hou, R. et al. Refining the processing dynamics of English compound words in L2 learners: a psycholinguistic modeling approach. Humanit Soc Sci Commun 13, 672 (2026). https://doi.org/10.1057/s41599-026-06999-2
Palabras clave: palabras compuestas, lectura en segunda lengua, seguimiento ocular, frecuencia de la palabra, transparencia semántica