Clear Sky Science · tr

ChunkyBERT: haber medyasında çok sınıflı siyasi yanlılık tespiti için yeni bir teknik

· Dizine geri dön

Haberlerde gizli eğilimlerin önemi

İnsanlar her gün siyasi başlıklar arasında gezinirken, kullanılan söylem ve hikâye seçimlerinin görüşlerini nasıl usulca yönlendirebileceğinin farkına varmayabilir. Bu çalışma, uzun haber makalelerinin sol, merkez veya sağ eğilimli olup olmadığını tespit etmek için tasarlanmış bir bilgisayar modeli olan ChunkyBERT’i sunuyor; model birkaç seçilmiş işaret yerine tüm metni kullanıyor. Amaç, okuyucuların, gazetecilerin ve denetleyicilerin modern dijital medyadaki önyargıyı daha net görmesine yardımcı olmak.

Siyasi eğilimlerin okuduklarımızı nasıl şekillendirdiği

Haber kuruluşları yalnızca ne söyledikleriyle değil, neyi dışarıda bıraktıkları, olayları nasıl çerçeveledikleri ve hangi duygusal ifadeleri seçtikleriyle de kamuoyunu etkileyebilir. Çevrimiçi platformlar çağında bu durum kutuplaşmayı derinleştirebilir, yankı odalarını besleyebilir ve yanıltıcı bilgilerin yayılmasına zemin hazırlayabilir. Önceki bilgisayar araçları bunu olumlu veya olumsuz kelimeleri sayarak ya da belirli terimlerin ne sıklıkta geçtiğini izleyerek ölçmeye çalıştı. Bunlar faydalı olmakla birlikte, mecaz, alay veya ince çerçeveleme gibi bağlamları yakalamakta zorlanır ve sıklıkla uzmanların çokça manuel düzenlemesini gerektirir.

El işi ipuçlarından tam metin okumaya

Dil teknolojisindeki son ilerlemeler, modellerin anlamı ham metinden doğrudan öğrenebilmesini sağladı. BERT gibi sinir ağları ve dönüştürücü tabanlı sistemler, kelimelerin bir cümlede ve paragraflar arasında birbirini nasıl etkilediğini yakalayabiliyor. Geçmişte birçok çalışma nefret söylemi, sahte haber veya duygu tespiti için bu araçları kullandı; bazıları kısa başlıklar veya tweet’lerden siyasi eğilim tahmin etmeye çalıştı. Ancak uzun siyasi makaleler hâlâ zorluk yaratıyor, çünkü standart modeller aynı anda ne kadar metin okuyabilecekleri konusunda sınırlamalara sahip ve yanlılık işaretleri tek bir çarpıcı alıntıda değil, hikâye boyunca dağılmış olabiliyor.

Figure 1. Tam siyasi makaleleri okuyan ve bunları sol, merkez veya sağ eğilimli gruplara ayıran sistem.
Figure 1. Tam siyasi makaleleri okuyan ve bunları sol, merkez veya sağ eğilimli gruplara ayıran sistem.

Uzun makaleleri daha yönetilebilir parçalara ayırmak

ChunkyBERT bu sorunu, her uzun makaleyi eşit uzunlukta daha küçük parçalara, yani parçalara (chunk) bölerek ele alıyor. Bu parçalar cümlelerle veya paragraflarla hizalanmıyor; bu da süreci bilgisayar için basit ve öngörülebilir tutuyor. Her parça daha sonra, kelimeleri bağlam içinde anlamlarını yakalayan sayısal desenlere dönüştüren önceden eğitilmiş bir dil modelinden geçiriliyor. İkinci bir dönüştürücü katmanı bu desenleri rafine ediyor ve bir dikkat (attention) adımı sistemin siyasi eğilimi en çok açığa çıkarıyor gibi görünen kelime ve ifadeleri sessizce vurgulamasına, nötr arka plan metnini ise geri plana atmasına olanak tanıyor.

Hikâyeyi yeniden bir araya getirmek

Her parça bu şekilde özetlendikten sonra, ChunkyBERT parça özetlerini ortalayarak makale için tek bir genel parmakizi oluşturuyor. Bu parmakizi daha sonra sol, merkez veya sağ arasında seçim yapan son bir karar katmanına giriyor. Araştırmacılar sistemi, çoğunluğu ABD kaynaklı olan ve politik etiketleri bilinen 37.000’den fazla haber makalesi üzerinde eğitip test etti. ChunkyBERT’i geleneksel makine öğrenmesi yöntemleri ve yine parça bölme ve dikkat kullanımlarıyla veya kullanımları olmadan tekrarlı ağlar ve zamansal konvolüsyonlara dayanan diğer sinirsel modellerle karşılaştırdılar.

Figure 2. Uzun makaleyi daha küçük parçalara bölme; her parça ayrı analiz edilip birleştirilerek siyasi eğilim kararı veriliyor.
Figure 2. Uzun makaleyi daha küçük parçalara bölme; her parça ayrı analiz edilip birleştirilerek siyasi eğilim kararı veriliyor.

Sistemin performansı ne durumda

Deneyler, ChunkyBERT’in makaleleri yaklaşık yüzde 86 doğrulama doğruluğuyla sınıflandırdığını ve sınıflar arasında ayrımı ne kadar iyi yaptığını kontrol eden standart bir ayırma ölçütünde güçlü bir sonuç elde ettiğini gösterdi. Özellikle açıkça sol veya sağ eğilimli parçaları tespit etmekte başarılı oldu; merkezci makaleler ise daha karışık tonları nedeniyle bazen iki taraftan biriyle karıştırıldı. Yazarların modelin parçalarını devre dışı bıraktıkları bir ablation çalışması, hem uzun belgelerin parçalara ayrılmasının hem de dönüştürücü katmanlarının yüksek performans elde etmek için kritik olduğunu ortaya koydu. Sistem ayrıca aynı veri seti üzerinde test edilen önceki yanlılık tespiti yöntemlerini de geride bıraktı.

Bu haber okuyucuları için ne anlama geliyor

Basitçe söylemek gerekirse, ChunkyBERT, tüm siyasi hikâyeleri tarayan ve bunların siyaset yelpazesinde nerede durduğunu tahmin eden dikkatli, yorulmaz bir okuyucu gibi davranır. Haberi önyargıdan arındırmaz ve hangi görüşlerin doğru olduğuna karar vermez, ancak aksi takdirde fark edilmeyebilecek eğilimleri işaretlemeye yardımcı olabilir. Diğer dillere ve bölgelere uyarlanıp iyileştirildiğinde, benzer araçlar medya izlemesini, sınıf tartışmalarını ve dijital okuryazarlık platformlarını destekleyerek bilgilerin ekranlara ulaşmadan önce nasıl şekillendirildiğine dair insanlara daha net bir görüş sağlayabilir.

Atıf: Loiya, D., Kulal, S.S., Reddy, M.S.M. et al. ChunkyBERT: a novel technique for multiclass political bias detection in news media. Sci Rep 16, 15323 (2026). https://doi.org/10.1038/s41598-026-46646-z

Anahtar kelimeler: siyasi medya yanlılığı, haber sınıflandırma, dönüştürücü modeller, BERT, dijital okuryazarlık