Clear Sky Science · tr
Sahte haberleri tanımada ve bunların yayılmasında etkili düğümleri belirlemede derin öğrenme ve ağ analizi kullanan çok modlu bir yaklaşım
Günlük yaşam için neden önemli
Her gün milyonlarca insan sosyal medyada sağlık, politika, para ve daha fazlasıyla ilgili gönderiler arasında gezinir. Yararlı bilgilerin arasında korku, kafa karışıklığı veya gerçek dünyada zarara yol açabilecek dedikodular ve sahte haberler bulunur. Bu çalışma iki şeyi aynı anda yapabilen güçlü bir yöntem sunuyor: birincisi, yanlış veya yanıltıcı gönderileri otomatik olarak tespit etmek; ikincisi, bu gönderilerin bir çevrimiçi toplulukta kimler tarafından yayılmasından en çok kimin sorumlu olduğunu haritalamak. Çalışma Covid‑19 hakkında Twitter mesajlarına odaklanıyor, ancak fikirler platformların, gazetecilerin ve kamuoyunun birçok alanda zararlı yanlış bilgilenmeye daha hızlı ve daha doğru şekilde yanıt vermesine yardımcı olabilir.

Dedikodular çevrimiçi kalabalıkta nasıl dalga oluşturur
Twitter, Facebook veya mesajlaşma uygulamaları gibi sosyal ağlar, etkileşimleri (bağlantılar) ile birbirine bağlanmış büyük insan ağları (düğümler) olarak düşünülebilir. Bir kullanıcı bir mesaj yayınladığında ve diğerleri yanıt verdiğinde veya paylaştığında, o bilgi ağ boyunca hızla dalga oluşturabilir. Doğrulanmamış veya yanlış iddialar olan dedikodular, bulaşıcı hastalıklara çok benzer şekilde davranır: kişiden kişiye atlayabilir, hızla büyüyebilir ve durdurulması zor olabilir. Önceki araştırmalar genellikle iki soruyu ayrı ele aldı: belirli bir gönderinin dedikodu olup olmadığını nasıl anlayacağımız ve bu dedikodunun birçok kişiye ulaşmasına yardımcı olan ana “yayımcıları” nasıl bulacağımız. Yazarlar, her iki soruyu birlikte ele almanın ve ağın nasıl bağlandığı ile etkinliğin zaman içinde nasıl değiştiğine dikkat etmenin, yanlış hikâyelerin nasıl hareket ettiğine dair çok daha net bir resim sunduğunu savunuyor.
Bir bilgisayara şüpheli gönderileri okumayı ve işaretlemeyi öğretmek
Yöntemin ilk kısmı her tweet’in içeriğine odaklanır. Araştırmacılar her tweet’i kısa bir belge olarak ele alır ve ekstra semboller gibi gereksiz öğeleri kaldırarak, web bağlantılarını ve e‑posta adreslerini basit etiketlerle değiştirerek ve fazla anlam katmayan yaygın dolgu kelimelerini çıkararak temizler. Ardından her kelimeyi, kelimelerin büyük metin kümelerinde birlikte görünme eğilimlerini yakalayan yaygın bir teknik olan GloVe kullanarak sayısal bir vektöre çevirirler. Bu kelime vektörlerini ortalayarak her tweet, anlamının kompakt bir sayısal özeti haline gelir. Bu özetler daha sonra bir boyutlu konvolüsyonel sinir ağına—ince desenleri tespit edebilen bir tür derin öğrenme modeline—verilir ve tweet’in gerçek bir mesaj mı yoksa bir dedikodu mu olduğuna karar verilir.
Ağın içindeki kilit yayımcıları bulmak
Sistem dedikodu tweet’lerini gerçeklerden ayırdıktan sonra, yaklaşımın ikinci kısmı sosyal ağın yapısına yönelir. Her kullanıcı yönlü, ağırlıklı bir grafikte bir noktadır ve her yanıt veya retweet, bir kullanıcının diğerinin mesajlarına ne sıklıkla tepki verdiğini yansıtan bir bağlantı olur. Bu bilgiyi kullanarak yazarlar önce kullanıcıları topluluklara—birbiriyle dışarıdakilere göre daha fazla etkileşimde bulunan gruplara—ayırır; bunu ağın özel bir ağaç temsili inşa edip daha sonra yakından bağlı alt grupları nasıl iyi uyduklarına göre birleştirerek yaparlar. Bu topluluklar içinde, her kullanıcının başkaları arasındaki en önemli yollar üzerinde ne sıklıkla yer aldığını hesaplarlar; bu ölçü betweenness (aradalık) olarak bilinir. Yüksek değerli yollar üzerinde tekrar tekrar görünen kullanıcılar etkili yayımcılar olarak değerlendirilir. Bağlantıların ağırlıkları, insanların ne sıklıkta etkileşimde bulunduğunu ve bağlı kullanıcıların ne kadar merkezi olduğunu yansıtacak şekilde güncellenir; bu da dedikoduların ağ boyunca zaman içinde en muhtemel izlediği yolları ortaya çıkarır.

Covid‑19 vaka çalışmasının ortaya koydukları
Çerçevelerini test etmek için araştırmacılar bunu Covid‑19 hakkında devasa bir Twitter veri kümesine uyguladılar: 150.000’in üzerinde kullanıcıyı içeren neredeyse 100 milyon tweet ve bunlardan 14.000’den fazla benzersiz mesajı öz bilgi veya dedikodu olarak etiketleyerek çıkardılar. Bu veride, derin öğrenme modelleri tweet’lerin yaklaşık yüzde 99’unu doğru sınıflandırdı ve diğer gelişmiş sahte haber algılayıcılar da dahil olmak üzere bazı mevcut yöntemleri geride bıraktı. İkinci aşamada, etkili kullanıcılar listelerini bilinen bir bilgi yayılımı matematiksel modeliyle karşılaştırdılar ve test edilen yöntemler arasında en yüksek uyumu buldular. Ayrıca daha uzun zaman dilimlerini—120, 240, sonra 360 gün—analiz ettiklerinde modelin kilit yayımcıları ve ana dedikodu yollarını belirleme yeteneğinin iyileştiğini ve bunu rakip ağ tabanlı tekniklere göre daha düşük işlem süresiyle yaptığını gösterdiler.
Yanlış bilgiyle mücadele için ne anlama geliyor
Basitçe söylemek gerekirse, çalışma yalnızca yüksek doğrulukla muhtemel sahte haberleri tespit eden değil, aynı zamanda bunların nasıl yayıldığını ve yayılmasından en çok kimin sorumlu olduğunu izleyen bir sistem kurmanın mümkün olduğunu gösteriyor. Tüm kullanıcıları ve tüm bağlantıları eşit varsaymak yerine yöntem, zararlı hikâyeleri kontrol altına almak için davranışı en çok önem taşıyan daha küçük bir topluluk ve birey setini öne çıkarıyor. Çalışma anonimleştirilmiş Covid‑19 Twitter verisi üzerinde yapılmış olup her platforma veya konuya doğrudan genellenemeyebilir; yine de çevrimiçi dedikodulara yönelik daha hedefli, veri odaklı müdahale yollarına işaret eder—örneğin doğrulama, uyarılar veya platform müdahalelerini en büyük etki yaratacağı yerlere yönlendirmek gibi—bunu yaparken bireysel gizliliği ve etik kullanımı gözetir.
Atıf: Zhang, W., Qian, M. & Zhang, Q. A multi-modal approach for recognizing fake news and influential nodes in spreading them using deep learning and network analysis. Sci Rep 16, 9775 (2026). https://doi.org/10.1038/s41598-026-35342-7
Anahtar kelimeler: sahte haber, sosyal ağlar, dedikodu yayılımı, derin öğrenme, etkili kullanıcılar