Clear Sky Science · tr
Sosyal kullanıcı coğrafi konumlandırması: K-medoids ve Gauss Çekirdeği grafik dikkat ağına dayalı
Tweet’lerinizin sizi nerede yaşadığınızı nasıl ortaya çıkarabileceği
Her gün milyonlarca kişi GPS koordinatlarını paylaşmadan sosyal medyada gönderi yapıyor. Yine de bu gönderiler, kullanıcıların nerede yaşadıkları, çalıştıkları ve seyahat ettikleri hakkında ipuçları bırakıyor. Kamuya açık bu izlerden konum çıkarabilmek, acil müdahale ve hastalık takibinden yerel öneriler ve hedefli hizmetlere kadar pek çok alanda önem taşıyor. Bu makale, hem insanların söylediklerini hem de çevrimiçi nasıl bağlandıklarını kullanarak konumu önceki yaklaşımlardan daha doğru tahmin eden KMKGAT adlı yeni bir yöntemi tanıtıyor.
Çevrimiçi sohbetten gerçek dünya yerlere
Kullanıcılar tweet veya mikro blog yazarken yer adlarından, yerel argo kullanımlarından veya yakın arkadaşlarla etkileşimlerinden söz edebilirler. Twitter (şimdi X) gibi şirketler bir kullanıcının internet adresini biliyor, ancak dış araştırmacılar ve hizmet sağlayıcılar genellikle bunu bilmiyor. Bunun yerine metin, kullanıcı profilleri ve kimin kimle iletişim kurduğu gibi kamuya açık bilgilerle çalışmak zorundalar. Önceki yöntemler üç gruba ayrıldı. Yalnızca içerik temelli yaklaşımlar kelimeler ve hashtag’leri kazıyıp konum tahmin etmeye çalıştı. Yalnızca ağ temelli yöntemler insanların genelde yakındaki kullanıcılarla etkileşim kurduğuna dayandı. Daha güçlü üçüncü bir aile ise her iki görüşü birleştirdi, ancak hâlâ özellikle seyrek nüfuslu alanlardaki kullanıcılar ve çevrimiçi bağlantıları geniş mesafeler kapsayan kullanıcılar için kör noktaları vardı.
Gerçek kullanıcı merkezleriyle daha akıllı coğrafi gruplanma
Temel sorun, sürekli dünyayı bir bilgisayarın öğrenip tahmin edebileceği bölgelere nasıl dönüştüreceğinizdir. Birçok sistem haritayı sabit bir ızgaraya böler. Bu şehirlerde makul derecede iyi çalışır, ancak kırsal alanlarda yüzlerce kilometreyi kapsayan dev hücrelerle başarısız olur. Yeni yöntem katı ızgaraların yerine k-medoids kümelemeyi koyar; bu, her bölgenin yapay bir nokta yerine gerçek bir kullanıcı etrafında merkezlenmesini sağlayan bir gruplama yoludur. Bu, bölgeleri kompakt ve aykırı değerlere karşı daha dayanıklı kılar, özellikle kullanıcıların seyrek olduğu yerlerde. Birleşik Devletler ve dünya genelini kapsayan üç büyük Twitter veri kümesi üzerinde yapılan testlerde bu uyarlanabilir bölütleme, ızgara tabanlı şemalara kıyasla tipik hataları azalttı ve kullanıcılar için daha gerçekçi “ev bölgeleri” sağladı.

Ağın benzer ve yakın kullanıcılara odaklanmasına izin vermek
İkinci yenilik, modelin sosyal grafikten nasıl öğrendiğindedir. Modern “graf dikkat ağları” zaten bir kullanıcının komşularına, özellik temsillerinin ne kadar benzer olduğuna göre farklı ağırlıklar veriyor. Ancak yalnızca benzerlik yanıltıcı olabilir: New York’taki bir hesap ile Londra’daki başka bir hesap benzer dil kullanımı sergileyebilir ancak coğrafi olarak uzak olabilirler. KMKGAT, dikkat mekanizmasını Gauss çekirdeğiyle zenginleştirir; bu, öğrenilmiş özellikleri hedef kullanıcıya yakın olan komşuları tercih eden ve uzak olanların etkisini azaltan matematiksel bir filtredir. Birden fazla böyle çekirdeğin mercek karışımı gibi birleştirilmesi modelin farklı ölçeklerde yerelliği yakalamasına olanak tanır. Bu, çevrimiçi etkileşimlerin genellikle fiziksel olarak daha yakın insanlar arasında daha güçlü olduğu basit ama güçlü ilkesine uygun davranır.

Hâlâ konum ipuçları taşıyan hafif metin özellikleri
Gürültülü, argo dolu tweet üslubuyla başa çıkmakta zorlanabilen ağır derin dil modellerine dayanmak yerine yazarlar, her kullanıcının gönderi koleksiyonunu ağırlıklı anahtar kelimeler çantasına dönüştürmek için klasik TF–IDF tekniğini kullanıyor. “The” veya “lol” gibi yaygın kelimeler düşük ağırlık alırken, daha nadir ve bölgeye özgü terimler ön plana çıkar. Bu metin özellikleri sonra her kullanıcıya sosyal grafikte eklenir ve geliştirilmiş dikkat ağı üzerinden geçirilir. İlginç bir şekilde, en iyi sonuçlar eğitim sırasında metin özelliklerinin çoğu rastgele bırakıldığında elde edildi; bu da konumla gerçekten yardımcı olan kelime oranının küçük olduğunu ve geri kalanının çoğunlukla gürültü eklediğini düşündürüyor.
Ölçeklenebilir olarak en iyi uygulamayı geride bırakmak
Performansı değerlendirmek için araştırmacılar, tahmin edilen bölge merkezinin her kullanıcının bilinen koordinatlarından kilometre cinsinden ne kadar uzakta olduğunu ve kullanıcıların yüzde kaçının gerçek konumlarına 161 km (100 mil) içinde yerleştirildiğini sordular. Üç kıyaslama Twitter veri kümesi genelinde KMKGAT tutarlı şekilde güçlü mevcut sistemlerle eşleşti veya onları geride bıraktı; 161 kilometre içindeki doğruluk birkaç yüzde puanı kadar iyileşti ki bu olgunluk seviyesinde anlamlı bir kazançtır. Fayda küçük ve orta ölçekli ağlarda daha belirgindi; devasa bir küresel grafikte yöntem, eğitim sırasında yalnızca doğrudan komşuları örneklemek zorunda kalması nedeniyle sınırlanmıştı.
Günlük yaşam açısından bunun anlamı
Uzman olmayanlar için çıkarılacak ders, konum etiketi hiç paylaşılmasa bile sosyal medya kullanıcılarının nerede olduğu tahmin etmenin giderek mümkün hale geldiğidir. Kullanıcıları gerçek hesaplara dayalı olarak gerçekçi bölgelere gruplandırarak ve modele sosyal ağda çoğunlukla yakın, benzer komşulara güvenmeyi öğreterek KMKGAT birinin muhtemelen nerede yaşadığını veya nereden gönderi yaptığını daraltır. Bu, felaketler sırasında müdahale edenlerin insanları bulmasına yardımcı olabilir, yerel arama ve önerileri geliştirebilir ve bilgilerin mekanlar arasında nasıl yayıldığına dair çalışmaları destekleyebilir. Aynı zamanda sıradan çevrimiçi etkileşimlerimizin çevrimdışı hayatımız hakkında ne kadar bilgi açığa vurabileceğini vurgulayarak düşünceli veri kullanımı ve gizlilik korumalarının önemini öne çıkarır.
Atıf: Jiao, A., Qiao, Y., Li, P. et al. Social user geolocation based on K-medoids and Gaussian Kernel graph attention network. Sci Rep 16, 5115 (2026). https://doi.org/10.1038/s41598-026-35532-3
Anahtar kelimeler: sosyal medya coğrafi konumlandırma, Twitter kullanıcı konumu, graf sinir ağları, konum tabanlı hizmetler, çevrimiçi gizlilik