Clear Sky Science · tr
Açık kaynak üretken Yapay Zeka ve makine öğrenmesi ile tematik analiz: tümevarımsal nitel kod defteri geliştirme için yeni bir yöntem
Günlük sorular için neden önemli
İnsanlar anketleri doldurup mülakat sorularını yanıtladıklarında, iş, okul, sağlık veya topluluk yaşamı hakkında zengin hikâyeler bırakırlar. Birkaç düzine cevabı okumak kolaydır; binlercesinin anlamını çıkarmak ise kolay değildir. Bu makale, araştırmacıların büyük yığınlardaki yazılı yorumları elenmesine ve ana fikirleri çıkarmasına yardımcı olmak için açık kaynaklı yapay zekayı nasıl kullanabileceklerini, ancak yorumlamada insanları hâlâ yetkili tutmayı sağlayan yeni bir yaklaşımı anlatır. Amaç, özenli ve nüanslı nitel araştırmayı genellikle büyük veri istatistiklerine ayrılan ölçeklerde mümkün kılmaktır.
Binlerce yorumu okumak için daha akıllı bir yol
Yazarlar, araştırmacıların metni okuyup araştırma sorularına yanıt veren tekrarlayan kalıpları veya “temaları” aradığı sosyal bilimlerde popüler bir yaklaşım olan tematik analize odaklanıyor. Geleneksel olarak bu, her yorumu elle yavaşça kodlamak ve tema ve alt-temaların yapılandırılmış bir listesi olan bir kod defteri oluşturmak anlamına gelir. Bu süreç birkaç düzine mülakat için iyi çalışabilir, ancak on binlerce açık uçlu yanıt olduğunda bunaltıcı hale gelir. Makale şu soruyu soruyor: erken, tekrarlayan işlerin yerini insan yargısını ortadan kaldırmadan serbestçe erişilebilen üretken metin modelleri ve diğer açık kaynak araçları alabilir mi?

GATOS iş akışını tanıtmak
Bu soruyu yanıtlamak için yazarlar Generative AI-enabled Theme Organization and Structuring (GATOS) yani Üretken Yapay Zeka Destekli Tema Organizasyonu ve Yapılandırma iş akışını tanıtıyor. Bu iş akışı birkaç adımı zincirler. Önce, açık kaynaklı bir dil modeli bireysel yanıtları okur ve her kişinin ne söylediğine dair kısa, odaklanmış özet noktalar yazar. Sonra başka bir araç bu özetleri bilgisayarın benzer fikirleri karşılaştırıp gruplayabilmesi için sayısal gösterimlere dönüştürür. Bu özetler, iş–yaşam dengesi konusundaki endişeler veya belirsiz iletişimden kaynaklanan hayal kırıklıkları gibi paylaşılan temaları yansıtması muhtemel gruplara kümeleşir.
Yapay zekanın yeni fikir önermesine izin vermek ama onları aşırı çoğaltmamak
En yeni adım, sistem taslak bir kod defteri oluşturmaya başladığında ortaya çıkar. İlgili özetler kümesindeki her küme için başka bir üretken model, o kümedeki fikirleri ve kod defterinde hâlihazırda bulunan kodları inceler. Ardından gerçekten yeni bir koda ihtiyaç olup olmadığını veya mevcut kodların yeterli olup olmadığını değerlendirir. Eğer “güvenilir görüntülü konferans araçları” gibi yeni bir açı ortaya çıkarsa, kısa bir etiket ve tanım önerir ve bu eklenir. Değilse, mevcut olanı yeniden kullanmayı seçer. Son adım, ilgili kodları daha geniş temalar altında gruplandırarak ham yorumlardan düzenlenmiş içgörülere giden yapılandırılmış bir harita oluşturur. Genel olarak amaç, neredeyse aynı kodların selini önlerken insanların deneyimlerindeki ince farklılıkları yakalamaktır.

Yöntemi gerçekçi yapay verilerle test etmek
Gerçek dünya çalışmaları nadiren bilinen bir “cevap anahtarı” ile geldiğinden, ekip GATOS’u gizli temaların önceden bilindiği sentetik (bilgisayar tarafından oluşturulan) verilerle test etti. Üç büyük, canlı veri seti oluşturdular: ekip çalışması hakkında akran geri bildirimi, işyerindeki etik kültür hakkındaki görüşler ve COVID-19 pandemisi sonrası ofise geri dönme konusundaki düşünceler. Her veri seti için önce sekiz tema ve birkaç alt-tema tanımladılar, sonra sendika üyeleri, yöneticiler veya öğrenciler gibi farklı kişiliklerden yüzlerce gerçekçi yanıt yazması için bir dil modeli kullandılar. GATOS’u bu veri setleri üzerinde çalıştırdıktan sonra insan değerlendiriciler yapay zekâ tarafından üretilen temaları orijinal, gizli alt-temalarla karşılaştırdı ve ne kadar uyuştuğunu inceledi.
Ne kadar iyi çalıştı ve hangi ödünler verildi?
Üç test vakasının tamamında iş akışı orijinal alt-temaların çoğunu oldukça yakın şekilde geri kazandı: büyük çoğunluğun en az bir güçlü eşleşmesi vardı ve yalnızca küçük bir kısmın iyi bir karşılığı yoktu. Önemli olarak, sistem daha fazla veriyi inceledikçe daha az yeni kod önerdi; bu, sonsuz varyasyonlar icat etmek yerine mevcut fikirleri yeniden kullanmayı öğrendiğini gösteriyor. Yazarlar, bu tür açık kaynaklı ve yerel olarak çalıştırılabilir bir kurulumun gizlilik endişelerini hafifletebileceğini ve farklı araştırma ekiplerinin birbirlerinin çalışmalarını tekrarlamasını kolaylaştırabileceğini savunuyor. Aynı zamanda, sentetik verilerin birçok gerçek dünya durumundan daha basit olduğunu, iş akışının hâlâ örtüşen kodlar yaratabileceğini ve nihai kod defterini rafine etmek, yorumlamak ve yargılamak için insan araştırmacıların hâlâ gerekli olduğunu vurguluyorlar.
Uzman olmayanlar için anlamı
Akademi dışındaki okuyucular için çıkarım şudur: açık kaynaklı yapay zekâ, sosyal bilimcilerin ve diğer araştırmacıların daha fazla insanı dinlemelerine yardımcı olabilir, ancak onların sözlerini kaba sayılara indirgemez. İnsan analistlerin yerini almak yerine, GATOS iş akışı çok hızlı ve çok düzenli bir asistan gibi davranır; kalıpları ve taslak etiketleri önerir, bu kalıpların gerçekte ne anlama geldiğine insanlar karar verir. Daha fazla çalışma bu sonuçları gerçek dünya verilerinde de doğrularsa, GATOS benzeri araçlar işyeri politikalarını, eğitim programlarını ve kamu kararlarını insanların gerçekten söylediklerinin zenginliğine dayandırmayı kolaylaştırabilir; sadece çoktan seçmeli anket kutularına değil.
Atıf: Katz, A., Fleming, G.C. & Main, J.B. Thematic analysis with open-source generative AI and machine learning: a new method for inductive qualitative codebook development. Humanit Soc Sci Commun 13, 209 (2026). https://doi.org/10.1057/s41599-026-06508-5
Anahtar kelimeler: nitel veri analizi, tematik analiz, üretken yapay zeka, açık kaynak dil modelleri, sosyal bilim araştırma yöntemleri