Clear Sky Science · tr
Eğitim içerikleri için grafik gösterim öğrenimine dayalı otomatik metin okunabilirliği değerlendirmesi
Öğretmenler ve Öğrenenler İçin Neden Önemli
Öğretmenler bir okuma metni seçerken hassas bir denge kurmak zorundadır: metin gelişimi teşvik edecek kadar zor olmalı, ama öğrencilerin pes etmesine yol açmayacak kadar da erişilebilir olmalı. Bu makale, özellikle eğitim materyalleri için bir pasajın okunmasının ne kadar zor olduğunu tahmin edebilen yeni bir yapay zeka yöntemi sunuyor. Basit kelime ve cümle sayımlarının ötesine, dilin daha derin yapısına bakarak sistem, geleneksel okunabilirlik formüllerinden daha doğru şekilde doğru metni doğru okurla eşleştirmeye yardımcı olmayı amaçlıyor.
Eski Usul Okunabilirlik Puanlarının Sınırları
Okullarda onlarca yıldır Flesch–Kincaid gibi yüzeysel ipuçları—cümle uzunluğu ve hece sayısı gibi—kullanan formüllere güvenildi. Bu yöntemler hesaplaması kolaydır ancak gerçek dünya karmaşıklığının birçok yönüne kördür. Kısa ama teknik terimlerle dolu bir fen paragrafı veya yapısı çarpık bir cümle, kelimeleri kısa ve cümleleri kısa olduğu için hâlâ “kolay” olarak etiketlenebilir. Sonuç olarak, öğretmenler özellikle fen ve sosyal bilgiler gibi içerik yoğun derslerde istemeden bazı öğrenciler için çok yoğun ya da başkaları için aşırı basit materyaller verebilir.
Cümlenin İçine Bakmak
Yazarlar her cümleyi bir ağ gibi ele alan farklı bir yaklaşım öneriyor. Her kelime bir nokta (veya düğüm) olur ve kelimeler arasındaki dilbilgisel bağlantılar—özne-fiil veya fiil-nesne gibi—bağlantılar (kenarlar) haline gelir. Kritik olarak, her bağlantının gücü yalnızca cümledeki uzaklığa değil, aradaki kelimelerin türlerine de bağlıdır. İsimler, fiiller ve sıfatlar gibi içerik ağırlıklı kelimelerle dolu uzun bir ara, zihinsel olarak daha zorlayıcı bir sıçrama önerir; kısa bir yol veya çoğunlukla küçük işlevsel kelimelerle dolu bir yol ise daha kolay bir adım işaret eder. Psikolinguistik araştırmalar, bu uzun, içerik yoğun dolambaçların çalışma belleğini zorladığını ve anlama hızını düşürdüğünü gösterdiğinden model bunları daha yüksek zorluk sinyalleri olarak kullanır.

Ağı Okumayı Öğretmek
Bu cümle-olarak-ağ fikrinden yararlanmak için çalışma, graf yapıları için tasarlanmış bir sinir ağı türü olan Graf Konvolüsyonel Ağ (Graph Convolutional Network) kullanıyor. Graf modeli çalışmadan önce, başka bir yapay zeka motoru (BERT gibi yaygın kullanılan sistemlere benzer) her kelimenin bağlam içindeki anlamını yansıtan zengin sayısal bir temsil oluşturur. Graf ağı daha sonra kelimeler arasındaki bağlantılar boyunca bilgi aktarır, anlam ve yapıyı harmanlayarak tüm pasajın tek bir özet temsiline dönüşür. Bu özet, basit bir derece aralığı yerine sürekli bir okunabilirlik puanı üreten son katmana verilir; bu da metinler arasında daha ince ayrımlar yapılmasına olanak tanır.
Modelden en iyi performansı almak için yazarlar Bayes optimizasyonu kullanıyor; bu, birçok "düğmenin" iyi ayarlarını otomatik olarak arayan bir stratejidir. Bunlar arasında farklı konuşma türlerinin bağlantı gücünü ne kadar etkilemesi gerektiği, kaç graf katmanı kullanılacağı ve modelin ne kadar hızlı öğrenmesi gerektiği bulunur. Bu seçimleri elle ayarlamak yerine optimizasyon prosedürü doğrulama sonuçlarına göre bunları sistematik olarak test eder ve iyileştirir.

Pratikte Ne Kadar İyi İşliyor
Model, uzman ataması yapılmış okunabilirlik puanları ve film tarzı içerik değerlendirmeleri (G, PG, PG-13 ve R) içeren yaklaşık 5.000 kısa pasajdan oluşan büyük CLEAR veri seti üzerinde test edildi. Titiz bir çapraz doğrulama düzeni kullanılarak sistem bu puanlardaki varyansın yaklaşık %97’sini açıklıyor; bu doğruluk seviyesi hem klasik öznitelik tabanlı yöntemleri hem de yalnızca dönüştürücü modellerine dayanan güçlü modern karşıtları aşıyor. Yöntem ayrıca metinleri kolay, orta ve zor düzeylerine sınıflandırmak için oluşturulmuş Farsça bir veri setine uygulandığında da iyi performans gösteriyor: aynı zorluk grubundaki pasajlar benzer tahmini puanlar alma eğiliminde, bu da modelin İngilizcede öğrendiği yapısal bilgilerin başka bir dile aktarıldığını düşündürüyor.
Bu Sınıflar İçin Ne Anlama Geliyor
Eğitimciler ve müfredat tasarımcıları için ana çıkarım şudur: okunabilirlik sadece uzun kelimeler ve uzun cümlelerle ilgili değildir. Bilginin bir cümle içinde nasıl işlendiği—dolambaç sayısı ve bunları dolduran kelime türleri—öğrencilerin takip etmesini ne kadar kolay ya da zor hale getireceği üzerinde büyük rol oynar. Metinleri bağlı kelimeler ağları olarak modelleyip bu ağları okumak için grafik tabanlı yapay zekâ kullanarak bu çalışma, okuma zorluğunu tahmin etmeye yönelik daha kesin ve esnek bir araç sunuyor. İnsan yargısının yerini almasa ve edebiyat ile sosyal bilim yazımlarının her nüansını hesaba katmasa da, öğretmenlerin öğrencilerinin becerilerine daha uygun metinleri seçmelerine ve uyarlamalarına yardımcı olarak daha kapsayıcı öğrenimi destekleyen güçlü bir karar yardımı olabilir.
Atıf: Zhang, L., Abhani, J., B, J. et al. Automatic text readability assessment for educational content based on graph representation learning. Sci Rep 16, 11308 (2026). https://doi.org/10.1038/s41598-026-41313-9
Anahtar kelimeler: okunabilirlik değerlendirmesi, eğitsel metinler, graf sinir ağları, doğal dil işleme, metin zorluğu