Clear Sky Science · tr

Çok boyutlu metin öznitelik füzyonuna dayalı BA-RILA ile eski Çin şiiri tema tanıma

· Dizine geri dön

Bilgisayarlara eski şiirleri okumayı öğretmenin önemi

Eski Çin şiirleri yüzyılların duygu, tarih ve günlük yaşamını barındırır; ancak dili modern Çince’den o kadar farklıdır ki uzmanlar bile anlam üzerinde sıkça tartışır. Kütüphaneler ve müzelerin bu eserleri dijitalleştirmesinin artmasıyla, şiirleri konularına göre hızla ayırabilen akıllı araçlara ihtiyaç büyüyor; bu araçlar akademisyenlerin, öğrencilerin ve halkın büyük koleksiyonları keşfetmesini kolaylaştırır. Bu çalışma, bilgisayarların eski bir şiirin ne hakkında olduğunu yalnızca sözcük anlamı ile değil, aynı zamanda ritim ve imgeleri de kullanarak daha iyi yakalamasını sağlayan yeni bir yöntem sunuyor.

Klasik şiirleri veriye dönüştürmek

Bir bilgisayara şiir öğretmek için araştırmacıların öncelikle uygun türden bir veri seti oluşturması gerekiyordu. Tang ve Song başta olmak üzere önemli Çin hanedanlıklarından yaklaşık 10.000 şiir topladılar ve her birini dostluk ve vedâ, tarih ve nostalji, manzaralar ve kır yaşamı, aşk ve evlilik, gurbet hasreti, sınır ve savaş gibi altı geniş tema altında dikkatle etiketlediler. Gürültülü veya eksik metinleri çıkardılar, klasik Çince’yi segmentlere ayırdılar ve çok anlam taşımayan işlevsel sözcükleri filtrelediler. Sözcük bulutu analizleri, her temanın kendine özgü bir kelime dağarcığı olduğunu gösterdi ve etiketlerin şiirsel içerikle iyi örtüştüğünü doğruladı.

Figure 1. Yapay zekânın, anlam, ses ve imgeleri kullanarak büyük antik Çin şiiri koleksiyonlarını temalara nasıl ayırdığı.
Figure 1. Yapay zekânın, anlam, ses ve imgeleri kullanarak büyük antik Çin şiiri koleksiyonlarını temalara nasıl ayırdığı.

Anlam, ses ve imgelerin harmanlanması

Çoğu dil teknolojisi yalnızca sözcük anlamına odaklanır; oysa klasik Çin şiiri aynı zamanda ses örüntüleri ve sembolik imgelere güçlü bir biçimde dayanır. Yeni BA-RILA modeli üç tür bilgiyi birleştiriyor. İlk olarak, bilgisayarın eski dilbilgisi ve klasik ifade kalıplarını daha iyi anlaması için antik Çince üzerinde yeniden eğitilmiş popüler BERT dil modelinin bir sürümünü kullanıyor. İkinci olarak, kafiye, dize uzunluğu, ton örüntüleri ve beyit yapıları gibi dizelerin nasıl duyulduğunu ve dengelendiğini yansıtan on bir sayısal özellik ile ritmi ölçüyor. Üçüncü olarak ise söğütlerin ayrılığı, ayın özlemi simgelemesi gibi 25 kültürel açıdan önemli simgeden oluşturulmuş 75 bölümlü bir tanımla şiirsel imgeleri izliyor; her simge için bir şiirdeki sıklık, duygusal ton ve gücü hesaplanıyor.

Modelin bütün şiirlerden öğrenme biçimi

Bu üç bilgi akışı ölçek bakımından farklılık gösterdiği için sistem önce bunları ortak bir uzaya eşliyor ve her şiir için anlam, ritim ve imgeye ne kadar ağırlık verileceğini belirleyen içsel bir dikkat mekanizması kullanıyor. Birleştirilmiş öznitelikler daha sonra şiiri hem ileri hem geri okuyarak zaman içinde anlamın nasıl geliştiğini yakalayan iki katmanlı yönlü bir tekrarlayan ağdan geçiyor. Çok başlıklı bir dikkat modülü, bu temsildeki en bilgilendirici kısımları aynı anda birkaç açıdan inceleyerek daha fazla öne çıkarıyor. Son olarak, tam bağlı katmanlardan oluşan bir set bu zengin iç görünümü altı tema üzerinden olasılığa dönüştürüyor ve hangi başlığın şiire en iyi uyduğuna karar veriyor.

Figure 2. Bir yapay zekâ modelinin, bir şiirin temasını belirlemek için anlamı, ritmi ve şiirsel imgeleri adım adım nasıl harmanladığı.
Figure 2. Bir yapay zekâ modelinin, bir şiirin temasını belirlemek için anlamı, ritmi ve şiirsel imgeleri adım adım nasıl harmanladığı.

Sistemin performansı

Kapsamlı testler BA-RILA’nın yalnızca modern BERT’e, konvolüsyonel ağlara veya daha basit tekrarlayan tasarımlara dayanan birkaç güçlü kıyas modelini açıkça geride bıraktığını gösteriyor. Altı temalı görevde yeni yöntem yaklaşık %97 doğruluk elde ediyor ve daha az yaygın temalarda bile istikrarlı performans sergiliyor. Yazarlar sistemin antik-Çince’ye uyarlanmış BERT’ini, ritim ve imge füzyonunu, tekrarlayan katmanları veya dikkat modülünü tek tek çıkardıklarında performans belirgin şekilde düştü; bu da her bir parçanın anlamlı katkı yaptığını gösteriyor. Model aynı zamanda Tang ve Song dönemlerinden şiirleri başarılı şekilde işledi, ancak Song şiirlerini ritimleri daha düzensiz ve dili daha yaygın olduğu için biraz daha zor buldu.

Klasik edebiyatı keşfetmek için ne anlama geliyor

Uzman olmayan biri için temel çıkarım, sözcük anlamını ses ve sembolik imgelerle birleştirmenin bilgisayarların eski şiirleri geleneksel okuma pratiklerini daha iyi yansıtan bir biçimde temalara ayırmasını sağlamasıdır. Şiiri sade metin olarak ele almak yerine BA-RILA yaklaşımı onun müzikalitesine ve kültürel imgelerine saygı gösteriyor ve daha güvenilir otomatik etiketlemeye yol açıyor. Bu tür araçlar büyük arşivlerde aramayı kolaylaştırabilir, hanedanlıklar arasında şairleri karşılaştırmayı veya gurbet hasreti ya da savaş gibi temaların zaman içinde nasıl evrildiğini incelemeyi destekleyerek hem akademik araştırmayı hem de klasik Çin kültürünün halk tarafından takdirini güçlendirebilir.

Atıf: Zhang, X., Liu, Y. Multi-dimensional text feature fusion-based BA-RILA for ancient Chinese poetry theme recognition. Sci Rep 16, 16573 (2026). https://doi.org/10.1038/s41598-026-48986-2

Anahtar kelimeler: antik Çin şiiri, tema sınıflandırması, metin öznitelik füzyonu, şiir imgeleri, kültürel NLP