Clear Sky Science · tr
Kullanıcı Deneyimi Algısı İçgörü Verisi (UXPID): Kamusal Endüstriyel Forumlardan Sentetik Kullanıcı Geri Bildirimleri
Çevrimiçi teknoloji sohbetleri neden önemli
Her gün dünya genelinde insanlar yazılımları veya endüstriyel cihazları beklenmedik şekilde davrandığında şirket destek forumlarına sorular ve şikâyetler gönderiyor. Bu başlıkların arasında gerçek kullanıcıların neyle mücadele ettiği, neleri beğendiği ve daha neler gerektiğine dair değerli bilgiler saklı. Ancak bu bilgiler dağınık, karışık ve çoğu zaman gizlilik kuralları nedeniyle erişimi kısıtlı. Bu makale, kimsenin kişisel bilgilerini açığa çıkarmadan o gizli bilgiye erişmenin yeni bir yolunu sunuyor.

Forum konuşmalarını araştırma yakıtına dönüştürmek
Yazarlar, User eXperience Perception Insights Dataset ya da kısaca UXPID’i sunuyor: kamusal bir endüstriyel otomasyon forumuna dayanan büyük bir sentetik kullanıcı tartışmaları koleksiyonu. İsimler, ürün kodları ve şirket ayrıntıları gibi hassas bilgiler içerebilecek orijinal gönderileri paylaşmak yerine, anlamı koruyup hassas ipuçlarını kaldıran özenle yeniden ifade edilmiş versiyonlar oluşturmuşlar. Her kayıt, bir kullanıcının sorusundan başlayan ve tüm yanıtları içeren bir tartışma dalını betimliyor; böylece araştırmacılar tek tek yorumları değil, bütün problem çözme konuşmalarını görebiliyor.
Dağınık konuşmalara yapı eklemek
UXPID’i öne çıkaran nokta, ham metnin üzerine eklenen zengin yapıdır. Ekip, her tartışmayı okuyup ana sorunun özetini, kullanıcının beklentisini ve problemin ciddiyetini üreten güçlü bir dil modeli kullanmış. Ayrıca her dalı konu etiketleriyle işaretlemiş, tonu olumlu, olumsuz veya tarafsız olarak sınıflandırmış ve acı noktaları, kazançları ve istenen özelliklere ilişkin kısa ifadeleri çıkarmış. Bu, serbest biçimli sohbetleri bilgisayarların öğrenebileceği düzenli bilgilere dönüştürüyor.

Hikâyeyi korurken kişileri anonimleştirmek
Forum katılımcılarını korumak merkezi bir hedefti. Dil modeline şirket adlarını, ürün etiketlerini, sürüm numaralarını, kişisel isimleri, e‑postaları ve web bağlantılarını basit yer tutucularla değiştirmesi ve her yorumu hafifçe yeniden ifade etmesi talimatı verildi. Bu otomatik işlemin ardından ekip, e‑posta veya IP formatları gibi kalan ipuçlarını yakalamak için desen eşleştirme çalıştırdı ve örnekleri elle denetledi. Ayrıca orijinal ve işlenmiş metinleri karşılaştırdılar; tüm büyük harfle yazma veya çoklu ünlem işaretleri azaltılmış olsa da cümle uzunluğu ve çeşitliliğin benzer kaldığını gösterdiler.
Veri kümesini teste tabi tutmak
Yeni veri kümesinin gerçekten işe yarayıp yaramadığını görmek için yazarlar iki tür bilgisayar modeli üzerinde eğitim denemeleri yaptılar. Biri klasik kelime sayımı yaklaşımıydı, diğeri ise bağlamı yakalayabilen modern bir transformer modeli olan DistilBERT’ti. Bu modellerden her tartışmanın konu etiketlerini ve genel havasını tahmin etmelerini istediler. Transformer tutarlı şekilde daha iyi performans gösterdi, özellikle birden çok konunun karışık olduğu zor durumlarda; bu da UXPID’in sorun tespiti ve duygu analizi gibi gelişmiş dil araçlarını destekleyecek kadar zengin olduğunu düşündürüyor.
Gelecek araçlar için bunun anlamı
Basitçe söylemek gerekirse, çalışma gürültülü, özel forum başlıklarını gerçek dünya ürün kullanımını yansıtan temiz, paylaşılabilir bir kaynağa dönüştürmenin mümkün olduğunu gösteriyor. UXPID, başkalarının ölçekli kullanıcı geri bildirimlerini okuyan ve anlayan sistemler geliştirmek ve karşılaştırmak için kullanabileceği binlerce anonimleştirilmiş, etiketlenmiş konuşma sunuyor. Bu, daha akıllı destek araçlarına, daha iyi ürün tasarım kararlarına ve müşteri deneyimindeki kalıpları tespit etmenin yeni yollarına yol açabilir; tüm bunlar, orijinal gönderileri yazan kişilerin gizliliğine saygı gösterirken gerçekleşebilir.
Atıf: Kulyabin, M., Joosten, J., Ulan uulu, C. et al. User eXperience Perception Insights Dataset (UXPID): Synthetic User Feedback from Public Industrial Forums. Sci Data 13, 762 (2026). https://doi.org/10.1038/s41597-026-07253-9
Anahtar kelimeler: kullanıcı geri bildirimi, teknik forumlar, doğal dil işleme, sentetik veri kümesi, kullanıcı deneyimi