Clear Sky Science · sv

Utforska AI:s prestanda i översättning av litterär självbiografi: hur nära matchar AI-modeller mänsklig översättning

· Tillbaka till index

Varför detta är viktigt för vanliga läsare

De flesta av oss förlitar sig nu på onlineöversättningsverktyg, och vissa använder till och med AI för att läsa romaner eller memoarer skrivna på andra språk. Men kan dessa system verkligen fånga känslan, rytmen och den kulturella djupet i en livshistoria? Denna studie undersöker hur tre populära AI-system och professionella mänskliga översättare hanterar en hyllad kinesisk litterär självbiografi, och visar var maskinerna utmärker sig, var de snubblar och vad det betyder för läsare som möter världslitteratur via en skärm.

Figure 1
Figure 1.

Berättelser som korsar språk

Forskningen fokuserar på The Great Flowing River, en brett uppskattad kinesisk självbiografi som blandar personligt minne med det omvälvande historiiska skeendet under krigsåren i Kina och efterkrigstidens Taiwan. Den engelska versionen producerades över flera år av ett team av erfarna översättare som arbetade nära författaren för att bevara både faktanoggrannhet och en lågmäld, känslomässigt återhållen stil. Denna omsorgsfulla mänskliga översättning används som referenspunkt. Mot den jämför författarna tre AI-utskrifter: Google Translates neurala maskinsystem, en allmän stor språkmodell (ChatGPT-4o) och en nyare resonemangsorienterad modell (OpenAI-o1). Alla fick i uppgift att översätta samma kapitel från kinesiska till engelska under vardagliga, standardinställningar, ungefär som en typisk användare skulle göra.

En titt under språkets huva

För att gå bortom magkänslor om ”bra” eller ”dåliga” översättningar använder studien ett verktyg som heter Coh-Metrix, vilket mäter över hundra egenskaper i engelska texter. Dessa sträcker sig från enkla räkningar—som hur många verb eller adjektiv som förekommer—till mer subtila egenskaper såsom hur tätt satserna hänger ihop, hur konkreta ordvalen är och hur lätt ett avsnitt är att följa. Författarna grupperar dessa mått i sex breda områden: ordval, satsstruktur, explicita länkar mellan idéer, djupare konceptuella kopplingar, ytliga drag som meningslängd, och övergripande läsbarhet. Genom att jämföra poäng över dessa dimensioner kan de kvantitativt visa hur nära varje AIs stil och struktur ligger den mänskliga översättningen.

Figure 2
Figure 2.

Hur de olika AI:erna beter sig

De tre AI-systemen visar sig ha distinkta ”personligheter.” Google Translate tenderar att använda vanligare vokabulär och relativt enkla meningar, vilket gör dess output lättläst men mindre rik och mindre knuten till berättarens personliga röst. Den använder färre första person plural-pronomen som ”we” och färre livfulla verb än människor, vilket försvagar känslan av delad erfarenhet som är central i en självbiografi. De två stora språkmodellerna föredrar däremot fler adjektiv och adverb och ett bredare ordförråd. Deras ordval kan kännas mer utsmyckat och dynamiskt, ibland genom att lägga till beskrivande inslag som inte betonades av de mänskliga översättarna. Detta kan på vissa ställen öka tydligheten men också riskera att rubba originalets återhållna ton, särskilt i passager där bokens kraft ligger i återhållsamhet snarare än yvighet.

Djup, koherens och känslomässiga undertoner

När det gäller hur idéer kopplas över satser och stycken matchar ingen av AI-systemen fullt ut de mänskliga översättarna. Den mänskliga versionen använder konsekvent upprepade substantiv, noggrant valda länord och tydliga orsak-och-verkan-tecken för att hjälpa läsaren följa komplexa händelser och känslomässiga skiften. AI:erna förlitar sig ofta mindre på sådana explicita vägvisare. Samtidigt överbetonar de ibland handling och kausalitet, genom att använda många kausala och intentionala verb som kan göra situationer mer entydiga men också mer bokstavliga än originalet. Den resonemangsorienterade modellen, OpenAI-o1, är särskilt benägen att dra in extra detaljer—som att ange en politisk ledares fullständiga namn eller att förvandla en ”förändring i omständigheterna” till en ”kris.” Dessa antaganden kan göra berättelsen mer direkt men också driva den bort från vad författaren faktiskt skrev.

Vilken AI känns mest människolik

Över de många mätningarna kommer ChatGPT-4o närmast profilen för de mänskliga översättarna. Den erbjuder i allmänhet rikare vokabulär och mer kontextmedvetna formuleringar än Google Translate, samtidigt som den undviker vissa av de djärvare tolkande språng som OpenAI-o1 gör. Google Translate, även om den är mindre nyanserad, förblir ofta mer trogen mot yttre ordalydelse och producerar mycket läsbar text, särskilt för icke-specialistpublik. OpenAI-o1, trots att den är utformad för att ”tänka hårdare,” ligger sämst till i detta specifika arbete. Dess styrka i resonemang leder den att omformulera eller utvidga vissa uttryck på sätt som kan vara stilistiskt olämpliga eller kulturellt inexakta för denna typ av litterär text.

Vad detta betyder för läsare och översättare

För en vanlig läsare är slutsatsen att dagens AI redan kan producera översättningar av litterär självbiografi som är flytande och ibland slående effektiva—men de når fortfarande inte upp till människors expertis när det gäller att bevara röst, subtil känsla och kulturell nyans. Bland de testade systemen erbjuder ChatGPT-4o i nuläget den närmaste approximationen till professionellt arbete, med Google Translate inte långt efter vad gäller praktisk läsbarhet. Den resonemangsorienterade modellen hamnar efter i just denna uppgift. Mänskliga översättare förblir dock avgörande: deras förmåga att väga ihop historia, kultur och stil gör att de kan bygga sammanhängande, känslomässigt flerdimensionella berättelser som maskiner bara delvis kan återskapa. I takt med att AI-verktygen fortsätter att förbättras antyder studien att de bäst bör ses inte som ersättare till litterära översättare, utan som kraftfulla hjälpmedel som fortfarande behöver mänskligt omdöme för att föra livsberättelser fullt ut över språkgränser.

Citering: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4

Nyckelord: litterär översättning, maskinöversättning, stora språkmodeller, kinesisk självbiografi, AI kontra mänskliga översättare