Clear Sky Science · tr
Halk sağlığı infoviglansı için bir büyük dil modelleri paketi
Çevrimiçi sohbetlerin halk sağlığı için neden önemi var
Salgınlar ve sağlık kaygıları sırasında birçok kişi önce resmi web sitelerine veya doktorlara değil sosyal medyaya başvurur. Bu paylaşımlar insanların nelerden korktuğunu, neleri yanlış anladığını ve önerilere nasıl tepki verdiğini ortaya koyar. Burada tanımlanan çalışma, PH-LLM adını taşıyan; çok dilli, sürekli çevrimiçi mesaj akışını okumak üzere özel olarak tasarlanmış bir yapay zekâ modelleri ailesini tanıtıyor; böylece sağlık yetkilileri sorunları erken görüp söylentiler ve endişeler kontrolden çıkmadan önce müdahale edebiliyor.
Sağlık konuşmalarını gerçek zamanlı izlemek
Kamu sağlığı kurumları kararları yönlendirmek için uzun zamandır anketlere, klinik raporlara ve laboratuvar verilerine güvendi. Ancak bu geleneksel araçlar yavaştır ve aşılar, testler ve yeni hastalıklarla ilgili inançların saatler içinde yayıldığı çevrimiçi ortamda hızla değişen havayı sıklıkla kaçırır. Araştırmacılar bu dijital nabzı izleme çabalarına "infoviglans" diyor — enfeksiyonlar yerine bilgiyi izlemek. Bugüne kadar bu tür çabaların çoğu, tek bir görev için eğitilmiş, daha küçük makine öğrenimi modellerine dayanıyordu; örneğin İngilizce tweetlerde aşı tereddüdünü tespit etmek gibi. Yeni bir konu, dil veya platform önem kazandığında bu sistemler ayak uydurmakta zorlanıyordu.

Halk sağlığı soruları için inşa edilmiş bir yapay zekâ paketi
Bu boşluğu doldurmak için yazarlar PH-LLM’i, halk sağlığı infoviglansı için özel olarak ayarlanmış büyük dil modelleri paketi olarak geliştirdiler. Güçlü bir çokdilli temel modelden başlayarak, 30 sosyal medya veri kümesinden ve birkaç sağlık soru–cevap kaynağından alınan yaklaşık 600.000 örnek üzerinde hafiften daha büyük modellere kadar altı sürümü ince ayar yaptılar. Bu örnekler, aşı tutumları, test yapma tereddüdü, ruh sağlığı belirtileri, nefret söylemi ve COVID-19 ile diğer konular hakkındaki yanlış bilgiler gibi geniş bir konu yelpazesini kapsadı. Her gönderiyi İngilizceye yeniden yazmak yerine, orijinal dilleri korudular ve modellerin karışık dildeki ve İngilizce dışı içerikleri doğal şekilde işleyebilmesi için talimat şablonlarını 29 dile çevirdiler.
PH-LLM’yi zorlu bir teste sokmak
PH-LLM’nin gerçek performansını ölçmek için ekip, İngilizce, Arapça, Çince ve Endonezyaca dillerinde 10 ayrı veri kümesinden alınan 39 görülmemiş görevden oluşan zorlu bir değerlendirme hazırladı. Bu görevler modellerden kişisel hikâyeleri haberlerden ayırmayı, nefret söylemini işaretlemeyi, tedaviler hakkında yanlış iddiaları tespit etmeyi ve COVID-19 aşılarına yönelik değişen duyguları saptamayı gibi işleri yapmasını istiyordu. PH-LLM’den hiçbir özel görev için ek eğitim almadan yani "sıfır atışlı" (zero-shot) ayarda yanıtlaması istendi. Araştırmacılar PH-LLM’nin doğruluğunu Llama, Mistral, BLOOMZ ve Qwen gibi açık kaynak modeller ile GPT-4o ve GPT-4o mini gibi ticari modeller dahil olmak üzere çok çeşitli tanınmış sistemlerle karşılaştırdı.
Daha küçük ama diller arasında daha güçlü
Hem yalnızca İngilizce hem de çokdilli görevlerde PH-LLM modelleri sadece rekabetçi olmakla kalmadı, aynı boyuttaki veya çok daha büyük alternatifleri sık sık geride bıraktı. 14 milyar ve 32 milyar parametreli sürümler genel performansta en iyi sonuçları vererek, açık kaynaklı daha büyük modelleri ve hatta karşılaştırma ölçütünde ortalama olarak ticari GPT-4o ailesini yendi. Önemli olarak, daha güçlü çokdilli sonuçlar PH-LLM’nin Arapça, Çince, Endonezyaca ve sıklıkla göz ardı edilen diğer dillerdeki sağlıkla ilgili konuşmaları izlemesine olanak tanıyor. PH-LLM birçok rakibinden daha az parametreyle bu doğruluk düzeyine ulaştığı için, daha mütevazı donanımlarda çalışabilir ve özellikle düşük- ve orta gelirli ülkelerdeki sağlık kurumları için maliyetleri azaltabilir.

Çevrimiçi sinyallerden gerçek dünya kararlara
Yazarlar PH-LLM’yi teknik olmayan kamu sağlığı çalışanlarının basit arayüzler aracılığıyla kullanabileceği pratik bir araç olarak tasavvur ediyor. Zaman, yer ve yerel koşullar hakkındaki bilgilerle birleştirildiğinde, PH-LLM’nin sınıflandırmaları aşı şüphelerinin nerede arttığını, hangi toplulukların nefret söyleminin hedefi olduğunu veya tehlikeli söylentilerin ne zaman yayılmaya başladığını ortaya koyabilir. Modellerin hâlâ sınırlamaları var — çok zor veya dengesiz görevlerde düzensiz performans ve sosyal medya verilerinden miras alınmış olabilecek önyargılar gibi — ancak bunlar halk sağlığı konuşmalarının gerçek zamanlı, çokdilli izlenmesine doğru büyük bir adımı temsil ediyor. Basitçe söylemek gerekirse, PH-LLM sosyal medyanın gürültülü akışını yetkililerin hem günlük kampanyalarda hem de gelecekteki pandemiler sırasında daha hızlı ve daha adil hareket etmelerine yardımcı olabilecek daha net sinyallere dönüştürüyor.
Atıf: Zhou, X., Zhou, J., Wang, C. et al. A suite of large language models for public health infoveillance. npj Digit. Med. 9, 270 (2026). https://doi.org/10.1038/s41746-026-02435-6
Anahtar kelimeler: halk sağlığı gözetimi, sosyal medya yanlış bilgilendirmesi, aşı tereddüdü, çok dilli yapay zeka, büyük dil modelleri