Clear Sky Science · tr
Yapay zekânın edebi otobiyografi çevirilerindeki performansını incelemek: Yapay zekâ modelleri insan çevirilerine ne kadar yakın?
Neden bu, günlük okurlar için önemli?
Çoğumuz artık çevrimiçi çeviri araçlarına güveniyoruz; bazıları başka dillerde yazılmış romanları veya anı kitaplarını okumak için yapay zekâyı kullanıyor. Peki bu sistemler gerçekten bir yaşam öyküsünün duygusunu, ritmini ve kültürel derinliğini yakalayabiliyor mu? Bu çalışma, üç popüler yapay zekâ sistemi ile profesyonel insan çevirmenlerin, övgüyle karşılanan bir Çin edebi otobiyografisini nasıl ele aldığını inceliyor; makinelerin hangi alanlarda öne çıktığını, nerede tökezlediğini ve bunun ekran aracılığıyla dünyanın edebiyatıyla karşılaşan okurlar için ne anlama geldiğini ortaya koyuyor. 
Dillerarası geçen hikâyeler
Araştırmacılar, kişisel anıları savaş dönemi Çin’i ve savaş sonrası Tayvan’ın çalkantılı tarihleriyle harmanlayan ve geniş çapta övgü alan The Great Flowing River adlı Çin otobiyografisine odaklanıyor. İngilizce sürümü, hem gerçeklerin doğruluğunu hem de sakin, duygusal açıdan ölçülü bir üslubu korumak için yıllarca yazarla yakın çalışmış uzman çevirmenler ekibi tarafından hazırlanmıştı. Bu titiz insan çevirisi ölçüt olarak ele alınıyor. Buna karşılık, yazarlar üç yapay zekâ çıktısını karşılaştırıyor: Google Translate’in sinirsel makine sistemi, genel amaçlı bir büyük dil modeli (ChatGPT-4o) ve daha yeni, akıl yürütmeye odaklı bir model (OpenAI-o1). Hepsinden, tipik bir kullanıcının yapacağı gibi gündelik, varsayılan ayarlar altında aynı bölümler Çince’den İngilizce’ye çevirmeleri istendi.
Dil mekanizmasının içlerine bakmak
“İyi” ya da “kötü” çeviriler hakkında sezgilere dayanmaktan öteye geçmek için çalışma, İngilizce metinlerin yüzün üzerinde özelliğini ölçen Coh-Metrix adlı bir araç kullanıyor. Bunlar basit sayımlardan—kaç fiil veya sıfat kullanıldığı gibi—cümleler arasındaki bağlantıların ne kadar sıkı olduğuna, sözcüklerin ne kadar somut olduğuna ve bir pasajın ne kadar kolay takip edildiğine dair daha ince özelliklere kadar uzanıyor. Yazarlar bu ölçümleri altı geniş alana gruplayarak inceliyor: kelime seçimi, cümle yapısı, fikirler arasındaki açık bağlantılar, daha derin kavramsal ilişkiler, cümle uzunluğu gibi yüzeysel özellikler ve genel okunabilirlik. Bu boyutlar arasındaki puanları karşılaştırarak, her bir yapay zekânın üslup ve yapısal olarak insan çevirisine ne kadar benzediğini nicel olarak gösterebiliyorlar. 
Farklı yapay zekâların davranışı
Üç yapay zekâ sisteminin belirgin “kişilikleri” olduğu ortaya çıkıyor. Google Translate daha yaygın kelimeler ve görece basit cümleler kullanma eğiliminde; bu da çıktısını okunması kolay ama anlatıcının kişisel sesiyle daha az bağlantılı kılıyor. İnsanların kullandığı “biz” gibi birinci çoğul zamirleri ve canlı fiilleri daha az kullanması, otobiyografinin merkezi olan paylaşılan deneyim hissini zayıflatıyor. Buna karşılık iki büyük dil modeli daha fazla sıfat ve zarf ile daha geniş bir kelime dağarcığını tercih ediyor. Bunların ifadeleri daha süslü ve dinamik gelebiliyor; bazen insan çevirmenlerin vurgulamadığı betimleyici dokunuşlar ekleyebiliyorlar. Bu bazı yerlerde açıklığı artırabilir, ancak özellikle güçlülüğünü ölçülü bir ifadeden alan pasajlarda eserin sade tonunu bozma riski taşıyor.
Derinlik, tutarlılık ve duygusal alt akımlar
Cümleler ve paragraflar arasındaki fikir bağlantılarına gelince, hiçbir yapay zekâ insan çevirmenlerle tamamen eşleşmiyor. İnsan çevirisi, okuyucuların karmaşık olayları ve duygusal geçişleri takip etmelerine yardımcı olmak için tekrarlanan isimlerin, özenle seçilmiş bağlayıcı sözcüklerin ve açık neden-sonuç işaretlerinin tutarlı kullanımını sağlıyor. Yapay zekâlar genellikle bu tür açık işaretlere daha az dayanıyor. Aynı zamanda bazen eylem ve nedenselliği fazla vurgulayarak birçok nedensel ve niyet belirten fiil kullanıyorlar; bu durum olayları daha doğrudan ama aynı zamanda özgün olandan daha literal kılabiliyor. Akıl yürütme odaklı model OpenAI-o1, özellikle ek ayrıntılar çıkarma eğiliminde—örneğin bir siyasi liderin tam adını belirtmek veya “koşullarda değişiklik”i “kriz”e dönüştürmek gibi. Bu varsayımlar anlatıyı daha doğrudan hissettirebilir ama yazarın gerçekten yazdıklarından uzaklaşılmasına da neden olabilir.
Hangi yapay zekâ en çok insanı andırıyor?
Çok sayıda ölçüm göz önüne alındığında ChatGPT-4o, insan çevirmenlerin profiline en yakın olanı olarak öne çıkıyor. Genel olarak Google Translate’e kıyasla daha zengin bir kelime hazinesi ve bağlam farkındalığına dayalı ifadeler sunuyor; aynı zamanda OpenAI-o1’in yaptığı daha cesur yorumlayıcı sıçramalardan bazılarını da yapmıyor. Google Translate, daha az nüanslı olsa da yüzey söz dizimine daha sadık kalma ve özellikle uzman olmayan okuyucular için çok okunaklı metin üretme eğiliminde. “Daha fazla düşünmesi” amaçlanmış olan OpenAI-o1 ise genel olarak bu özel görevde insan çevirisine en az uyan model olarak kalıyor. Akıl yürütme konusundaki güçlü yanları, belirli ifadeleri üslup açısından uygunsuz veya kültürel olarak hatalı olabilecek biçimlerde yeniden çerçevelemesine ya da genişletmesine yol açıyor.
Bu, okurlar ve çevirmenler için ne anlama geliyor?
Günlük bir okur için çıkarılacak ders, günümüz yapay zekâlarının edebi otobiyografi çevirilerini akıcı ve kimi zaman çarpıcı biçimde etkili üretebildiği, ancak yine de ses, ince duygu ve kültürel nüansı koruma konusunda insan uzmanlarının gerisinde kaldığıdır. Test edilen sistemler arasında ChatGPT-4o şu anda profesyonel işlere en yakın yaklaşımı sunuyor; Google Translate ise pratik okunabilirlik açısından pek uzağı düşmüyor. Akıl yürütme odaklı model bu özel görevde daha geride kalıyor. Ancak insan çevirmenler hâlâ vazgeçilmez: tarih, kültür ve üslubu tartma yetenekleri, makinelerin yalnızca kısmen yeniden üretebildiği tutarlı ve duygusal katmanlara sahip anlatılar kurmalarına olanak tanıyor. Yapay zekâ araçları gelişmeye devam ettikçe, bu çalışma onların edebi çevirmenlerin yerine değil, yaşam öykülerini diller arasında tam anlamıyla yaşatmak için hâlen insan yargısına ihtiyaç duyan güçlü yardımcılar olarak görülmesinin daha doğru olduğunu öne sürüyor.
Atıf: Huang, Y., Cheung, A.K.F. Exploring AI’s performance in literary autobiography translation: how closely do AI models match human translation. Humanit Soc Sci Commun 13, 518 (2026). https://doi.org/10.1057/s41599-026-06630-4
Anahtar kelimeler: edebi çeviri, makine çevirisi, büyük dil modelleri, Çin otobiyografisi, Yapay zekâ ve insan çevirmenler