Clear Sky Science · tr

SCAD: Çin şiirlerinde gönderme tespitine yönelik kendiliğinden denetimsiz karşıtlık öğrenimi

· Dizine geri dön

Antik Dizelerde Gizli Mesajlar

Klasik Çin şiirleri, ünlü hikâyelere, efsanelere ve tarihî kişiliklere yapılan gizli göndermelerle doludur. Bu "göndermeler" duygusal derinlik ve kültürel zenginlik katar, ancak aynı zamanda şiirleri hem modern okurlar hem de bilgisayarlar için anlaşılması güç kılar. Bu makale, geniş ölçekte gömülü bu göndermeleri otomatik olarak açığa çıkarabilen yeni bir yapay zeka sistemi olan SCAD’i tanıtıyor; bu, Çin edebiyatını okuma, öğretme ve araştırma için daha akıllı dijital araçların önünü açıyor.

Şiirde Göndermelerin Önemi

Yüzyıllardır Çinli şairler göndermeleri bir tür edebi kısaltma olarak kullanmışlardır. İdilî bir saklı köyü ya da yas tutan bir nehir tanrıçasını anıştırarak, birkaç karakterle karmaşık duyguları ifade edebilirlerdi. Sorun şu ki, bu ima çoğunlukla ince olur. Bir şiir, dayandığı hikâyenin adını hiç anmayabilir; bunun yerine o geleneğe bağlı bir mekânı, nesneyi veya görüntüyü çağrıştırır. Aynı kelime bağlama göre farklı hikâyelere işaret edebildiği için, gelişmiş bilgisayar sistemleri bile, özellikle binlerce olası aday ve sınırlı etiketli eğitim verisi olduğunda, bir şiirin hangi göndermeyi kullandığını güvenilir biçimde tanımakta zorlanır.

Figure 1
Figure 1.

Karşılaştırmalardan Öğrenen Makine Öğretimi

Yazarlar bu zorluğu, klasik Çin diline özel olarak uyarlanmış kendiliğinden denetimsiz karşıtlık öğrenimi adı verilen bir stratejiyle ele alıyorlar. İnsanlardan her şiiri doğru göndermeyle etiketlemelerini istemek yerine, 14.000’den fazla şiirin 1.025 belirli göndermeyi nasıl alıntıladığını belgeleyen seçkin bir web sitesinden büyük bir şiir–gönderme çifti koleksiyonu kuruyorlar. Her gerçek çift—gerçekte belli bir hikâyeyi kullanan bir şiir—için aynı şiiri birçok alakasız göndermeyle eşleştirerek otomatik olarak "negatif" çiftler oluşturuyorlar. SCAD, ilişkili şiir–gönderme metinlerini iç temsil alanında birbirine yaklaştırıp alakasız olanları uzaklaştırarak gerçek çifti sahte olanlardan ayırt etmeyi öğreniyor.

Antik Çin Metinlerine Uygun Bir Model

SCAD’in altyapısı, önmodern Çin yazıları üzerine eğitilmiş bir dil modeli olan SikuBert üzerine kuruludur. Sistem hem şiiri hem de göndermeyi (kaynağındaki orijinal pasaj dahil) ortak bir kodlayıcıya besleyerek modelin bir şiirdeki belirli ifadelerin hikâyenin ayrıntılarıyla nasıl etkileştiğine odaklanmasını sağlıyor. Kodlayıcıya hafif "adaptör" modüller ekleniyor; böylece yalnızca az sayıda yeni parametrenin eğitilmesi gerekiyor ve ince ayar verimli oluyor. İyileştirilmiş bir kayıp fonksiyonu, modelin yanıltılmaya en yatkın olduğu en zor negatif örneklere ekstra ağırlık veriyor; bu sayede SCAD yalnızca kolay vakalardan değil, en yaygın hatalarından da öğreniyor.

Mevcut Yaklaşımları Geride Bırakmak

SCAD, önceki derin öğrenme sistemleri, kural tabanlı yöntemler ve hatta geniş amaçlı büyük dil modelleri dahil olmak üzere çeşitli alternatiflere karşı test edildiğinde, bir şiirde doğru göndermeyi adlandırmada belirgin şekilde daha doğru olduğunu gösteriyor. Doğru cevabı ortalamada daha üst sıralara yerleştirmekle kalmıyor, aynı zamanda test vakalarının yaklaşık beşte dördünde doğru göndermeyi en üst tercih olarak tanımlıyor; önceki tekniklere göre açık bir kazanç. Çıkarım çalışmaları, her tasarım seçiminin katkı sağladığını gösteriyor: modern yerine klasik dil ön eğitimi kullanmak, göndermenin tüm kaynak metnini dahil etmek, adaptör eklemek ve zor negatif örneklere yeniden ağırlık vermek, özellikle nadir veya ince göndermelerde performansı artırıyor.

Figure 2
Figure 2.

Yeni Bağlantılar Keşfetmek ve Bilgi Haritaları Oluşturmak

Ham doğruluğun ötesinde, yazarlar SCAD’in nasıl genelleşebileceğini ve kararlarını nasıl açıklayabileceğini araştırıyorlar. "Sıfır atışlı" (zero-shot) testlerde, kasıtlı olarak bazı ünlü göndermeleri ve bunlarla ilişkili şiirleri eğitimden çıkarıyorlar ve sonra SCAD’den yine de onları tanımasını istiyorlar. Sistem hâlâ güçlü performans gösteriyor; bu, modelin sabit bir kontrol listesini ezberlemek yerine şairlerin hikâyelere nasıl göndermede bulunduğuna dair genel kalıpları öğrendiğini düşündürüyor. Bu kararların içini görmek için ekip, SCAD’in tahminini en çok etkileyen şiirdeki belirli kelimeleri vurgulayan LIME adlı bir yorumlanabilirlik yöntemini uyguluyor. Bu sinyalleri kullanarak neredeyse 10.000 "gönderme sözcüğü" çıkarıyorlar ve bunları şiirleri, çağrıştırıcı ifadeleri ve hatırlattıkları hikâyelerle bağlayan bir bilgi grafiğinde bir araya getiriyorlar—arama, çalışma araçları ve etkileşimli quiz’leri güçlendirebilecek bir kaynak.

Antik İma ve İşaretleri Dijital Çağa Taşımak

Özetle, bu çalışma doğru eğitim sinyalleri ve mimariyle makinelerin klasik Çin şiirine gömülü edebi göz kırpmaları ve ima biçimlerini yakalamaya başlayabileceğini gösteriyor. SCAD yalnızca bir şiirin hangi hikâyeyi sessizce çağırdığını tespit etmekle kalmıyor; yeni göndermelere genelleme yapabiliyor ve şiirleri birbirine ve daha geniş kültürel geleneğe bağlayan karmaşık göndermeler ağına haritalar çıkarmaya yardımcı olabiliyor. Okurlar, öğrenciler ve akademisyenler için bu yaklaşıma dayanan sistemler, dünyanın en çok göndermeye sahip edebiyatlarından bazılarındaki gizli anlam katmanlarını aydınlatan rehberler haline gelebilir.

Atıf: Shi, B., Bu, W., Li, X. et al. SCAD: self-supervised contrastive learning for allusion detection in Chinese poems. Humanit Soc Sci Commun 13, 293 (2026). https://doi.org/10.1057/s41599-026-06627-z

Anahtar kelimeler: klasik Çin şiiri, edebi göndermeler, karşıtlık öğrenimi, dijital beşeri bilimler, doğal dil işleme