Clear Sky Science · it

Esplorare le prestazioni dell’IA nella traduzione di autobiografie letterarie: quanto si avvicinano i modelli di IA alla traduzione umana

· Torna all'indice

Perché questo conta per i lettori comuni

Oggi la maggior parte di noi si affida a strumenti di traduzione online e alcuni usano persino l’IA per leggere romanzi o memorie scritte in altre lingue. Ma questi sistemi sono davvero in grado di catturare l’emozione, il ritmo e la profondità culturale di una storia di vita? Questo studio analizza come tre sistemi di IA popolari e traduttori professionisti affrontano un’autobiografia letteraria cinese acclamata, rivelando dove le macchine eccellono, dove inciampano e cosa significa per i lettori che incontrano la letteratura mondiale attraverso uno schermo.

Figure 1
Figure 1.

Storie che attraversano le lingue

I ricercatori si concentrano su The Great Flowing River, un’autobiografia cinese molto apprezzata che fonde memoria personale con la storia turbolenta della Cina in tempo di guerra e della Taiwan del dopoguerra. La versione inglese è stata realizzata in anni di lavoro da un team di traduttori esperti che hanno collaborato strettamente con l’autore per preservare sia l’accuratezza fattuale sia uno stile pacato ed emotivamente controllato. Questa traduzione umana accurata è trattata come punto di riferimento. Contro di essa gli autori confrontano tre output di IA: il sistema di traduzione neurale di Google Translate, un modello linguistico generalista (ChatGPT-4o) e un modello più recente focalizzato sul ragionamento (OpenAI-o1). A tutti è stato chiesto di tradurre gli stessi capitoli dal cinese all’inglese con impostazioni quotidiane e predefinite, proprio come farebbe un utente tipico.

Uno sguardo sotto il cofano linguistico

Per andare oltre le impressioni su traduzioni “buone” o “cattive”, lo studio utilizza uno strumento chiamato Coh-Metrix, che misura oltre cento caratteristiche dei testi in inglese. Queste vanno da conteggi semplici—come il numero di verbi o aggettivi presenti—a proprietà più sottili come la coesione fra le frasi, la concretezza del lessico e la facilità di lettura di un passaggio. Gli autori raggruppano queste misure in sei aree ampie: scelta delle parole, struttura della frase, legami espliciti tra le idee, connessioni concettuali più profonde, caratteristiche superficiali come la lunghezza delle frasi e leggibilità complessiva. Confrontando i punteggi attraverso queste dimensioni, possono mostrare, in termini quantitativi, quanto lo stile e la struttura di ciascuna IA somiglino alla traduzione umana.

Figure 2
Figure 2.

Come si comportano le diverse IA

I tre sistemi di IA mostrano in effetti “personalità” distinte. Google Translate tende a usare un vocabolario più comune e frasi relativamente semplici, rendendo il suo output facile da leggere ma meno ricco e meno legato alla voce personale del narratore. Usa meno pronomi in prima persona plurale come “we” e verbi vividi rispetto agli umani, il che attenua la sensazione di esperienza condivisa, centrale in un’autobiografia. I due modelli di grandi dimensioni, al contrario, privilegiano più aggettivi e avverbi e una gamma lessicale più ampia. La loro formulazione può risultare più elaborata e dinamica, talvolta aggiungendo tocchi descrittivi che i traduttori umani non avevano evidenziato. Ciò può migliorare la chiarezza in alcuni punti, ma rischia anche di alterare il tono sobrio dell’originale, specialmente nei passaggi in cui la forza del libro deriva dalla moderazione e non dallo sfoggio stilistico.

Profondità, coerenza e correnti emotive

Per quanto riguarda il modo in cui le idee si connettono tra frasi e paragrafi, nessuno dei sistemi di IA eguaglia pienamente i traduttori umani. La versione umana utilizza con coerenza sostantivi ripetuti, parole di collegamento accuratamente scelte e indizi chiari di causa-effetto per aiutare i lettori a seguire eventi complessi e cambiamenti emotivi. Le IA spesso fanno meno affidamento su questi segnali espliciti. Allo stesso tempo, talvolta enfatizzano eccessivamente azione e causalità, usando molti verbi causali e intenzionali che possono rendere le situazioni più lineari ma anche più letterali rispetto all’originale. Il modello orientato al ragionamento, OpenAI-o1, tende particolarmente a inferire dettagli aggiuntivi—come specificare il nome completo di un leader politico o trasformare un “cambiamento di circostanze” in una “crisi”. Queste congetture possono rendere la narrazione più diretta ma anche allontanarla da ciò che l’autore ha effettivamente scritto.

Quale IA appare più simile a un umano

Considerando le numerose misure, ChatGPT-4o è quello che più si avvicina al profilo dei traduttori umani. In genere offre un vocabolario più ricco e una resa delle espressioni più consapevole del contesto rispetto a Google Translate, evitando al contempo alcune delle audaci interpretazioni di OpenAI-o1. Google Translate, pur meno sfumato, resta spesso più fedele al lessico superficiale e produce testi molto leggibili, particolarmente adatti a un pubblico non specialistico. OpenAI-o1, nonostante sia progettato per “pensare di più”, si allinea meno bene alla traduzione umana in questo compito specifico. I suoi punti di forza nel ragionamento lo portano a riformulare o espandere certe espressioni in modi che possono risultare stilisticamente incongrui o culturalmente imprecisi per questo tipo di scrittura letteraria.

Cosa significa per lettori e traduttori

Per il lettore comune, la conclusione è che le IA odierne possono già produrre traduzioni di autobiografie letterarie scorrevoli e talvolta sorprendentemente efficaci—ma rimangono al di sotto degli esperti umani nel preservare la voce, le sfumature emotive e le finezze culturali. Tra i sistemi esaminati, ChatGPT-4o offre attualmente l’approssimazione più vicina al lavoro professionale, con Google Translate non molto lontano in termini di leggibilità pratica. Il modello orientato al ragionamento è invece in ritardo per questo compito specifico. I traduttori umani, però, restano essenziali: la loro capacità di ponderare storia, cultura e stile consente di costruire narrazioni coerenti e stratificate emotivamente che le macchine riproducono solo in parte. Man mano che gli strumenti di IA migliorano, questo studio suggerisce di considerarli non come sostituti dei traduttori letterari, ma come potenti ausili che richiedono comunque il giudizio umano per trasportare pienamente le storie di vita tra le lingue.

Citazione: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4

Parole chiave: traduzione letteraria, traduzione automatica, grandi modelli linguistici, autobiografia cinese, IA vs traduttori umani