Clear Sky Science · tr

Sosyal medya verilerinde psikolojik boyutları keşfetmek için konu analiz modellerinden yararlanmak

2026-01-23 · Dizine geri dön

Çevrimiçi Sözlerimiz Neden Önemli

Milyonlarca insan her gün sosyal medyada duygularından bahsediyor; çoğu zaman yüz yüze olabileceklerinden daha açık bir şekilde. Bu sıradan yorumlar denizinin içinde, depresyon veya kendine zarar verme işaretleri de dahil olmak üzere ruh sağlığına dair değerli ipuçları saklıdır. Bu çalışma, sonuçları büyük olabilecek basit bir soruyu soruyor: modern yapay zeka gürültülü çevrimiçi sohbetleri tarayıp anlamlı temaları bulabilir ve profesyonellerin psikolojik riskleri daha iyi anlamalarına yardımcı olabilir mi — her gönderiyi tek tek okumadan?

Kaosu Temalara Dönüştürmek

Araştırmacılar, depresyon teşhisi konulduğunu söyleyen kullanıcıları ve bilinen teşhisi olmayan bir kontrol grubunu içeren eRisk girişiminden geniş bir Reddit gönderi koleksiyonuna odaklandı. Amaç bireyleri teşhis etmek değildi; konu analizinin — metinleri paylaşılan temalara göre gruplayan tekniklerin — ruh sağlığıyla ilgili desenleri ortaya çıkarıp çıkaramayacağını görmekti. Sosyal medya dili argo, yazım hataları ve ani konu değişimleriyle dolu olduğu için bu yöntemler için gerçekçi fakat çok zorlayıcı bir test oluşturuyor.

İnsanların Ne Konuştuklarını Keşfetmenin Üç Yolu

Çalışma üç farklı konu modeli ailesini karşılaştırdı. İlki Latent Dirichlet Allocation (LDA), belgelerde kelimelerin birlikte ne sıklıkta göründüğüne bakan klasik bir yöntem. İkincisi BERTopic, her gönderiyi zengin sayısal gösterimlere dönüştürmek için güçlü modern dil modellerinden yararlanıyor, benzer gönderileri kümeleyip her grup için anahtar kelimeleri çıkartıyor. Üçüncüsü TopClus da sinir ağlarına dayanıyor; dikkat mekanizmaları ve kümelemeyi ortak bir matematiksel alanda birleştiriyor. Üç modeli de varsayılan ayarlarla çalıştırıp her biri için 50 konu ürettiler; bu, birçok araştırmacının kutudan çıktığı gibi kullanma yaklaşımını taklit ediyor.

Yalnızca Formüller Değil, İnsanlar da Soruldu

Hangi konuların gerçekten anlamlı olduğunu değerlendirmek için ekip yalnızca otomatik puanlara güvenmedi. Altı eğitimli kodlayıcı, her biri en üst kelimelerle ve birkaç merkezi gönderiyle temsil edilen 150 konuyu inceledi. Her konu için kelime listesinin ne kadar tutarlı olduğunu, örnek gönderilerin ne kadar tutarlı olduğunu ve kelimelerle gönderilerin birbirleriyle ne kadar örtüştüğünü puanladılar. Mümkün olduğunda her konuya kısa, sezgisel bir ad vermeye de çalıştılar. Bu insan merkezli yaklaşım önemli bir bulguyu ortaya koydu: araştırmalarda popüler olan sayısal “tutarlılık” metrikleri, özellikle karışık sosyal medya metinlerinde, insan yargılarıyla sıklıkla çelişiyordu.

Açık Kazanan ve Ortaya Çıkardıkları

Tüm insan değerlendirmeleri göz önüne alındığında, BERTopic açıkça en anlaşılır ve spesifik konuları üretti. Kodlayıcılar, BERTopic'in konularına diğer modellere göre çok daha sık isim verebildiler ve aralarında sağlam, orta düzeyde bir uyum vardı. LDA ise sıklıkla ilgisiz kelimeleri ve gönderileri bir araya getirerek değerlendiricilere neredeyse rastgeleymiş hissi veren gruplar oluşturdu. En iyi konular seçildikten sonra araştırmacılar insanların gerçekte ne hakkında konuştuğunu derinlemesine incelediler. "Ruh sağlığı mücadeleleri" ve "Kendine zarar" gibi temalar depresyonlu kullanıcılarla güçlü şekilde bağlantılıydı ve çok sayıda sıkıntı belirten gönderi içeriyordu. Diğerleri daha açıkça klinik değildi — örneğin "Kilo verme yolculuğu", "Cinsiyet kimliği", "Cinsel rüyalar" ve "Sosyal içme görgüsü" — ama depresyonlu kullanıcıların payının yüksek olduğu ve birçok duygusal acı işareti barındırdığı ortaya çıktı. Basit zaman temelli bir analiz, bu hassas konulardan bazılarındaki aktivitenin COVID-19 pandemisi sırasında hızla arttığını gösterdi; bu da daha geniş ruh sağlığı kötüleşme raporlarını yansıtıyor.

Çevrimiçi Kalıplardan Gerçek Dünyada Yardıma

Bazı gönderilerin ne kadar ciddi olabileceğini daha iyi anlamak için yazarlar, içeriği iyi bilinen bir depresyon anketinin (Beck Depresyon Envanteri) maddelerine kabaca eşleyen ayrı bir dil modeli kullandılar. Bu keşifsel adım, özellikle ruh sağlığı mücadeleleri, kendine zarar, beden imajı ve cinsiyet kimliği etrafındaki bazı konuların sıklıkla orta ila ağır depresif semptomlarla ilişkili dil içerdiğini öne sürdü. Yazarlar bu tür otomatik okumaların klinik teşhis olmadığını vurguluyor, ancak uzman dikkatinin en acil şekilde gerektiği yerleri vurgulamaya yardımcı olabileceğini belirtiyorlar.

Ruh Sağlığı ve Teknoloji İçin Ne Anlama Geliyor

Düz bir anlatımla, çalışma günümüzün en gelişmiş konu modellerinin — özellikle BERTopic'in — kaotik sosyal medya konuşmalarını gerçek psikolojik endişelerle uyumlu açık temalara dönüştürebildiğini gösteriyor. Ayrıca otomatik kalite puanlarına körü körüne güvenmenin riskli olduğunu; hedef ruh sağlığı kararlarını desteklemekse insan incelemesinin hâlâ vazgeçilmez olduğunu ortaya koyuyor. Gelecekte benzer araçlar, klinisyenlerin, kamu kurumlarının ve araştırmacıların geniş eğilimleri izlemesine, ortaya çıkan riskleri tespit etmesine ve daha iyi önleme çabaları tasarlamasına yardımcı olabilir — nihai yargı ve bakımın ise insan profesyonellere bırakılacağı koşuluyla.

Atıf: Couto, M., Parapar, J. & Losada, D.E. Exploiting topic analysis models to explore psychological dimensions in social media data. Sci Rep 16, 6047 (2026). https://doi.org/10.1038/s41598-026-36339-y

Anahtar kelimeler: sosyal medya ve depresyon, konu modelleme, ruh sağlığı kalıpları, çevrimiçi kendine zarar sinyalleri, psikolojide dil modelleri