Clear Sky Science · es

Explorando el rendimiento de la IA en la traducción de autobiografía literaria: ¿qué tan cerca están los modelos de IA de la traducción humana?

· Volver al índice

Por qué esto importa a los lectores cotidianos

Hoy en día la mayoría de nosotros dependemos de herramientas de traducción en línea, y algunos incluso usan IA para leer novelas o memorias escritas en otros idiomas. Pero, ¿pueden estos sistemas capturar realmente la emoción, el ritmo y la profundidad cultural de una vida? Este estudio examina cómo tres sistemas de IA populares y traductores humanos profesionales afrontan una celebrada autobiografía literaria china, revelando dónde las máquinas destacan, dónde tropiezan y qué implica eso para los lectores que encuentran la literatura mundial a través de una pantalla.

Figure 1
Figure 1.

Historias que cruzan lenguas

Los investigadores se centran en El gran río que fluye (The Great Flowing River), una autobiografía china muy elogiada que mezcla la memoria personal con la turbulenta historia de la China en guerra y la posguerra en Taiwán. Su versión inglesa se produjo durante años por un equipo de traductores expertos que trabajaron estrechamente con la autora para preservar tanto la exactitud factual como un estilo contenido y emocionalmente contenido. Esta cuidadosa traducción humana se toma como referencia. Frente a ella, los autores comparan tres resultados de IA: el sistema neuronal de Google Translate, un modelo de lenguaje general (ChatGPT-4o) y un modelo más reciente enfocado en el razonamiento (OpenAI-o1). A todos se les pidió traducir los mismos capítulos del chino al inglés con configuraciones cotidianas y por defecto, tal como lo haría un usuario corriente.

Asomando bajo el capó del lenguaje

Para ir más allá de las intuiciones sobre traducciones “buenas” o “malas”, el estudio utiliza una herramienta llamada Coh-Metrix, que mide más de cien rasgos de textos en inglés. Estos van desde conteos sencillos —como cuántos verbos o adjetivos aparecen— hasta propiedades más sutiles, como la cohesión entre frases, la concreción del lenguaje y la facilidad para seguir un pasaje. Los autores agrupan estas medidas en seis áreas amplias: elección de palabras, estructura de la oración, vínculos explícitos entre ideas, conexiones conceptuales más profundas, rasgos superficiales como la longitud de las oraciones y la legibilidad general. Al comparar las puntuaciones en estas dimensiones pueden mostrar, en términos cuantitativos, qué tan parecidos en estilo y estructura son los resultados de cada IA con respecto a la traducción humana.

Figure 2
Figure 2.

Cómo se comportan las distintas IAs

Los tres sistemas de IA resultan tener “personalidades” distintas. Google Translate tiende a usar un vocabulario más común y oraciones relativamente simples, lo que hace que su salida sea fácil de leer pero menos rica y menos vinculada a la voz personal del narrador. Utiliza menos pronombres de primera persona del plural como “we” y menos verbos vivos que los humanos, lo que debilita la sensación de experiencia compartida que es central en la autobiografía. Los dos modelos de lenguaje a gran escala, en cambio, prefieren más adjetivos y adverbios y una gama más amplia de vocabulario. Su redacción puede sentirse más elaborada y dinámica, a veces añadiendo matices descriptivos que los traductores humanos no enfatizaron. Esto puede mejorar la claridad en algunos lugares, pero también corre el riesgo de alterar el tono contenido del original, especialmente en pasajes donde la fuerza del libro proviene de la contención más que del ornamento.

Profundidad, coherencia y corrientes emocionales

En lo relativo a cómo las ideas se conectan entre frases y párrafos, ninguno de los sistemas de IA iguala por completo a los traductores humanos. La versión humana hace un uso consistente de sustantivos repetidos, palabras de enlace cuidadosamente elegidas y señales claras de causa y efecto para ayudar a los lectores a seguir eventos complejos y cambios emocionales. Las IAs con frecuencia dependen menos de esas señales explícitas. Al mismo tiempo, a veces sobreenfatizan la acción y la causalidad, usando muchos verbos causales e intencionales que pueden hacer las situaciones más directas pero también más literales que el original. El modelo orientado al razonamiento, OpenAI-o1, es particularmente propenso a inferir detalles adicionales —por ejemplo, especificar el nombre completo de un líder político o transformar un “cambio de circunstancias” en una “crisis”. Estas conjeturas pueden hacer que la narración parezca más directa, pero también desviarse de lo que realmente escribió la autora.

Qué IA se siente más humana

En las numerosas mediciones, ChatGPT-4o es el que más se aproxima al perfil de los traductores humanos. En general ofrece un vocabulario más rico y frases más conscientes del contexto que Google Translate, evitando al mismo tiempo algunas de las interpretaciones más audaces de OpenAI-o1. Google Translate, aunque menos matizado, a menudo se mantiene más fiel al texto superficial y produce un texto muy legible, particularmente para audiencias no especializadas. OpenAI-o1, a pesar de estar diseñado para “pensar más”, se alinea en menor medida con la traducción humana en esta tarea. Sus fortalezas en razonamiento lo llevan a reformular o expandir ciertas expresiones de modos que pueden resultar estilísticamente inapropiados o culturalmente inexactos para este tipo de escritura literaria.

Qué significa esto para lectores y traductores

Para un lector general, la conclusión es que las IAs actuales ya pueden producir traducciones de autobiografía literaria que son fluidas y en ocasiones sorprendentemente efectivas, pero aún se quedan cortas frente a los expertos humanos a la hora de preservar la voz, las emociones sutiles y la matización cultural. Entre los sistemas evaluados, ChatGPT-4o ofrece actualmente la aproximación más cercana al trabajo profesional, con Google Translate no muy lejos en términos de legibilidad práctica. El modelo orientado al razonamiento queda rezagado en esta tarea específica. Los traductores humanos, sin embargo, siguen siendo cruciales: su capacidad para ponderar historia, cultura y estilo les permite construir narrativas coherentes y con capas emocionales que las máquinas solo replican parcialmente. A medida que las herramientas de IA sigan mejorando, este estudio sugiere que deben verse no como reemplazos de los traductores literarios, sino como ayudas potentes que todavía requieren el juicio humano para trasladar por completo las historias de vida entre idiomas.

Cita: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4

Palabras clave: traducción literaria, traducción automática, modelos de lenguaje a gran escala, autobiografía china, IA vs traductores humanos