Clear Sky Science · fr

Explorer les performances de l’IA dans la traduction d’autobiographies littéraires : dans quelle mesure les modèles d’IA se rapprochent-ils de la traduction humaine

2026-03-07 · Retour à l’index

Pourquoi cela compte pour le lecteur ordinaire

La plupart d’entre nous utilisent désormais des outils de traduction en ligne, et certains se servent même de l’IA pour lire des romans ou des mémoires écrits dans d’autres langues. Mais ces systèmes parviennent-ils vraiment à saisir l’émotion, le rythme et la profondeur culturelle d’un récit de vie ? Cette étude examine comment trois systèmes d’IA populaires et des traducteurs humains professionnels traitent une autobiographie littéraire chinoise saluée, en révélant où les machines excellent, où elles trébuchent et ce que cela signifie pour les lecteurs qui découvrent la littérature mondiale via un écran.

Des histoires qui traversent les langues

Les chercheurs se concentrent sur The Great Flowing River, une autobiographie chinoise largement acclamée qui mêle mémoire personnelle et histoire tourmentée de la Chine en temps de guerre puis du Taiwan d’après-guerre. Sa version anglaise a été réalisée sur plusieurs années par une équipe de traducteurs experts travaillant en étroite collaboration avec l’auteur afin de préserver à la fois l’exactitude factuelle et un style sobre et émotionnellement retenu. Cette traduction humaine soignée sert de référence. Les auteurs la confrontent à trois rendus d’IA : le système neuronal de Google Translate, un grand modèle de langage polyvalent (ChatGPT-4o) et un modèle plus récent axé sur le raisonnement (OpenAI-o1). Tous ont été sollicités pour traduire les mêmes chapitres du chinois vers l’anglais en paramètres par défaut, comme le ferait un utilisateur lambda.

Regarder sous le capot linguistique

Pour dépasser les impressions subjectives de « bonne » ou « mauvaise » traduction, l’étude utilise un outil appelé Coh-Metrix, qui mesure plus d’une centaine de caractéristiques des textes en anglais. Celles-ci vont de comptes simples — comme le nombre de verbes ou d’adjectifs — à des propriétés plus subtiles telles que la cohésion entre phrases, le degré de concrétude du vocabulaire et la facilité de suivi d’un passage. Les auteurs regroupent ces mesures en six grandes familles : choix des mots, structure des phrases, liens explicites entre les idées, connexions conceptuelles plus profondes, caractéristiques de surface comme la longueur des phrases, et lisibilité globale. En comparant les scores selon ces dimensions, ils peuvent montrer, en termes quantitatifs, à quel point le style et la structure de chaque IA ressemblent à la traduction humaine.

Comment se comportent les différentes IA

Les trois systèmes d’IA révèlent des « personnalités » distinctes. Google Translate a tendance à utiliser un vocabulaire plus courant et des phrases relativement simples, rendant son texte facile à lire mais moins riche et moins lié à la voix personnelle du narrateur. Il emploie moins de pronoms de première personne du pluriel comme « we » et moins de verbes saisissants que les humains, ce qui atténue le sentiment d’expérience partagée central dans l’autobiographie. Les deux grands modèles de langage, en revanche, favorisent davantage d’adjectifs et d’adverbes et un éventail lexical plus large. Leur formulation peut sembler plus élaborée et dynamique, ajoutant parfois des touches descriptives que les traducteurs humains n’avaient pas renforcées. Cela peut améliorer la clarté par endroits mais risque aussi de perturber le ton retenu de l’original, surtout dans des passages où la puissance du livre vient de la retenue plutôt que de l’emphase.

Profondeur, cohérence et sous-courants émotionnels

En ce qui concerne la manière dont les idées se lient entre phrases et paragraphes, aucune des IA n’égale pleinement les traducteurs humains. La version humaine recourt de façon cohérente à la répétition de noms, à des mots de liaison soigneusement choisis et à des indices clairs de cause à effet pour aider le lecteur à suivre des événements complexes et des basculements émotionnels. Les IA s’appuient souvent moins sur ces jalons explicites. Parallèlement, elles exagèrent parfois l’action et la causalité, utilisant de nombreux verbes causaux et d’intention qui peuvent rendre les situations plus simples mais aussi plus littérales que l’original. Le modèle orienté raisonnement, OpenAI-o1, a particulièrement tendance à inférer des détails supplémentaires — par exemple en précisant le nom complet d’un dirigeant politique ou en transformant un « changement de circonstances » en « crise ». Ces suppositions peuvent rendre le récit plus direct mais aussi s’éloigner de ce que l’auteur a effectivement écrit.

Quelle IA paraît la plus humaine

Sur l’ensemble des mesures, ChatGPT-4o se rapproche le plus du profil des traducteurs humains. Il propose généralement un vocabulaire plus riche et des formulations plus attentives au contexte que Google Translate, tout en évitant certaines des extrapolations interprétatives plus audacieuses d’OpenAI-o1. Google Translate, bien que moins nuancé, reste souvent plus fidèle au libellé de surface et produit un texte très lisible, en particulier pour un public non spécialiste. OpenAI-o1, malgré sa conception axée sur un « raisonnement approfondi », s’aligne globalement le moins bien sur la traduction humaine. Ses forces en raisonnement le poussent à reformuler ou étendre certaines expressions d’une manière qui peut être stylistiquement inappropriée ou culturellement inexacte pour ce type d’écriture littéraire.

Ce que cela signifie pour les lecteurs et les traducteurs

Pour le lecteur non spécialiste, la leçon est que les IA d’aujourd’hui peuvent déjà produire des traductions d’autobiographies littéraires fluides et parfois remarquablement efficaces — mais elles restent en deçà des experts humains pour préserver la voix, les émotions subtiles et les nuances culturelles. Parmi les systèmes testés, ChatGPT-4o offre actuellement l’approche la plus proche du travail professionnel, Google Translate n’étant pas loin en termes de lisibilité pratique. Le modèle axé sur le raisonnement est à la traîne pour cette tâche spécifique. Les traducteurs humains, cependant, restent essentiels : leur capacité à peser l’histoire, la culture et le style leur permet de construire des récits cohérents et émotionnellement stratifiés que les machines ne reproduisent que partiellement. À mesure que les outils d’IA s’amélioreront, cette étude suggère de les voir non pas comme des remplaçants des traducteurs littéraires, mais comme des aides puissantes nécessitant encore le jugement humain pour faire passer pleinement des vies d’une langue à l’autre.

Citation: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4

Mots-clés: traduction littéraire, traduction automatique, grands modèles de langage, autobiographie chinoise, IA vs traducteurs humains