Clear Sky Science · tr
Çince klasiklerin İngilizce çevirilerinin okunabilirlik değerlendirmesi: XGBoost ve BP sinir ağlarına dayalı bir çalışma
Neden kadim bilgelik hâlâ anlaşılır İngilizceye ihtiyaç duyuyor
Konfüçyüs’ün Analektleri iki binden fazla yıldır Çin düşüncesini şekillendirdi, ancak birçok İngilizce okur yine de metni izlemek konusunda zorlanıyor. Farklı çeviriler özgüne sadık kalmaya çalışırken aynı zamanda okunabilir olmayı da hedefliyor, ancak hangi sürümlerin bugünün okurları için daha kolay anlaşıldığı açık değil. Bu makale, Analektler’in birkaç İngilizce çevirisinin ne ölçüde okunabilir olduğunu ölçmek için modern dil teknolojisi ve makine öğrenimini kullanıyor ve klasik eserlerin diller ve kültürler arasında nasıl dolaştığını veri odaklı bir yaklaşımla ele alıyor.

Tek bir klasik kitap için birçok ses
Çalışma, on dokuzuncu ile yirmi birinci yüzyıllar arasında James Legge, William Jennings, D. C. Lau, Edward Slingerland ve Burton Watson tarafından yapılmış beş tam Analektler İngilizce çevirisine odaklanıyor. Beş çevirmen de aynı Klasik Çince kaynak metinden yararlandı, ancak farklı üslup ve yorumlama tercihleri yaptılar. Adil bir karşılaştırma yapmak için yazarlar her çeviriyi Çince metindeki geleneksel söylev bölünmelerine kabaca karşılık gelecek şekilde 1412 kısa satıra böldü. Üç çeviri modelleri eğitmekte kullanıldı, iki çeviri ise modellerin yeni pasajları ne kadar iyi değerlendirebildiğini test etmek amacıyla ayrıldı.
Cümleleri ölçülebilir sinyallere dönüştürmek
Flesch Reading Ease gibi tek bir tanıdık formüle dayanmak yerine araştırmacılar, korpustaki her satır için çok daha zengin bir 114 gösterge seti oluşturdu. Bazıları cümle uzunluğu ve ortalama kelime boyutu gibi temel özelliklere bakan geleneksel okunabilirlik formülleriydi. Diğerleri uzun veya nadir kelimelerin sayısı, kelime seçimlerinin çeşitliliği ve bilgi yoğunluğu gibi sözvarlığı özelliklerini yakaladı. Üçüncü bir grup cümle yapısını betimliyordu; örneğin bir cümlenin kaç yan cümle içerdiği ya da belirli dilbilgisi kalıplarının ne sıklıkta ortaya çıktığı gibi. Son olarak, güncel bir dokunuş eklendi: büyük bir dil modeli (BERT), her satırın korpusun geri kalanıyla karşılaştırıldığında ne ölçüde anlamsal olarak “tipik” olduğunu tahmin ederek anlam düzeyinde bir tutarlılık endeksi sağladı.
Makinelere zorluğu hissettirmeyi öğretmek
Bu göstergeleri kullanarak yazarlar, her satır için bileşik okunabilirlik puanlarını tahmin etmek üzere iki makine öğrenimi modeli—bir XGBoost modeli ve basit bir geri yayılım sinir ağı—eğitti. Bu puanlar dokuz geleneksel formülün birleşik çıktısına dayanıyordu ve modellere öğrenmeleri için istikrarlı bir hedef sundu. Eğitime başlamadan önce her gösterge ile puanlar arasındaki korelasyonları incelediler. Uzun, çok heceli veya teknik açıdan zor kelimelerle dolu satırlar, toplam karakter sayısı ve daha karmaşık cümle yapıları genellikle daha zor olarak değerlendirildi. Buna karşılık, bazı ince dilbilgisel sayımlar yalnızca sınırlı bir rol oynadı. Her iki makine öğrenimi modeli de tutulmuş veride eğitim örüntülerini son derece iyi yeniden üretti; bu da bu özellik karışımının Analektler’den bir pasajı kolay veya zor kılan unsurların büyük bir bölümünü yakaladığını öne sürüyor.

Çevirmenleri genel ve ayrıntılı olarak karşılaştırmak
Eğitildikten sonra modeller Slingerland ve Watson’a ait iki test çevirisi üzerinde çalıştırıldı. Geniş çapta, araştırmacılar tahmin edilen puanları en kolaydan en zora kadar bantlara ayırdı ve her çeviriden kaç satırın hangi banda düştüğünü saydı. Watson’ın tercümesi genel olarak biraz daha kolay çıktı: onun satırlarının daha fazlası yüksek-okunabilirlik bantlarına düştü, oysa Slingerland’ın çevirisi daha uzun cümleler ve daha süslü ifadeler kullanma eğilimindeydi. Daha ince bir düzeyde ekip, iki çevirmenin keskin şekilde ayrıldığı bireysel söylevlere baktı. Bu durumlarda, daha zor satırlar tipik olarak birden fazla faktörün birleşimini içeriyordu—uzun cümleler, iç içe geçmiş yan cümleler, soyut veya nadir sözvarlığı ve tek bir satıra sıkıştırılmış yoğun yorum—oysa daha kolay satırlar genellikle daha kısa, daha doğrudan ifadeleri ve daha basit kelime seçimlerini tercih ediyordu.
Bulguların okurlar ve çevirmenler için anlamı
Konfüçyüs’e İngilizce yaklaşmak isteyen uzman olmayan okurlar için çalışma, en azından ham okuma çabası açısından bazı çevirilerin diğerlerine göre daha pürüzsüz bir yol sunduğunu öne sürüyor. Çevirmenler ve akademisyenler içinse nicel araçların binlerce satır boyunca güçlük örüntülerini görünür kılarak geleneksel yakın okumayı nasıl tamamlayabileceğini gösteriyor. Yazarlar okunabilirliğin iyi bir çevirinin yalnızca tek bir yönü olduğunu; özgün anlam ve edebi üsluba sadakatin de önemli olduğunu vurguluyor. Yine de cümle uzunluğu, yapı ve kelime seçiminin Analektler’i İngilizce okuma deneyimini nasıl şekillendirdiğini ortaya koyarak bu çalışma, Çince klasiklerin daha erişilebilir baskılarına ve nihayetinde daha açık kültürlerarası söyleşilere doğru bir yön işareti sunuyor.
Atıf: Yang, L., Zhou, G. Readability assessment of English translations of Chinese classics: a study based on XGBoost and BP neural networks. Humanit Soc Sci Commun 13, 588 (2026). https://doi.org/10.1057/s41599-026-06878-w
Anahtar kelimeler: metin okunabilirliği, makine öğrenimi, Konfüçyüs Analektleri, edebi çeviri, doğal dil işleme