Clear Sky Science · tr

Arapça çevrimiçi sağlık bilgisi kalite değerlendirmesinin güvenilirliğini PCA ve ICA özellik ağırlıklandırmasıyla geliştirilmiş BERT mimarisi kullanarak artırma

· Dizine geri dön

Çevrimiçi sağlık tavsiyeleri neden akıllı bir filtreye ihtiyaç duyar

Zaten daha fazla insan kalp hastalıkları, felçler, tansiyon ve diğer acil sağlık sorunları hakkında cevapları internetten arıyor. Yine de birçok Arapça web sitesi eksik, güncelliğini yitirmiş veya basitçe yanlış tavsiyeler veriyor. Bu makale, araştırmacıların Arapça tıbbi web sayfalarını okuyan ve bilgilerin güvenilir olup olmadığını insan uzmanlara yakın doğrulukla değerlendiren bir yapay zeka sistemi nasıl inşa ettiğini anlatıyor. Amaçları, hastaların, ailelerin ve gelecekteki dijital asistanların yanıltıcı sağlık tavsiyelerinden kaçınmasına yardımcı olmak.

İyi sağlık bilgisini kötü olandan ayırmak

Yazarlar, ciddi bir sorunu vurgulayarak başlıyor: çevrimiçi sağlık bilgilerinin çoğu düşük kalitede, ancak insanlar genellikle bunları güvenilirmiş gibi kabul ediyor ve bazen bir doktora gitmek yerine bunlara dayanıyor. Web sayfalarını otomatik olarak derecelendirme girişimleri geçmişte çoğunlukla İngilizce ile sınırlı kaldı, kaliteyi dar tanımlarla ele aldı ve yapay zeka sistemlerinin ne kadar emin veya iyi kalibre olduğuna yeterince dikkat etmedi. Bu çalışma Arapça içeriğe odaklanıyor ve bilgiyi kimin yazdığı, güncelliği, kanıta dayalı olup olmadığı ve tedavi yararları ile risklerini ne kadar açık anlattığı gibi daha kapsamlı bir kalite bakışı kullanıyor. İnsan değerlendiriciler, kalp krizi ve felç gibi acil durumlarla ilgili yüzlerce Arapça web sayfasını puanlayarak “yüksek kalite” ve “düşük kalite” sayfaların ayrıntılı bir referans veri setini oluşturdular.

Figure 1
Figure 1.

Bir makineye Arapça tıbbi metin okumayı öğretmek

Yeni sayfaları değerlendirmek için araştırmacılar modern dil modellerine—metni anlamak üzere eğitilmiş yapay zeka sistemlerine—başvurdular. Başlangıçta Arapça BERT ile çalıştılar; bu güçlü model her kelimeyi anlam ve bağlamı yakalayan yüksek boyutlu bir uzayda nokta olarak temsil ediyor. Ardından modeli Arapça tıbbi kitaplar ve web sitelerinden elde edilen 100 milyondan fazla kelime üzerinde eğiterek özelleştirilmiş bir tıbbi versiyon oluşturdular; böylece model teknik ifadeleri ve semptomlar ile tedavi biçimlerinin yaygın anlatımlarını daha iyi kavrayabiliyor. Web sayfaları uzun olabileceğinden, ekip bunları yönetilebilir parçalara özetledi ve yazım varyasyonları ile özel karakterlerin modeli yanıltmaması için metni temizledi.

Karmaşık örüntüleri anlamlandırmak

BERT bir web sayfasını sayısal örüntülere dönüştürdüğünde bile sonuç büyük ve kısmen tekrarlı olur. Bu nedenle yazarlar, bu örüntüleri daha küçük ve bilgi açısından zengin özellik setlerine sıkıştırmak için Ana Bileşen Analizi (PCA) ve Bağımsız Bileşen Analizi (ICA) gibi matematiksel araçlar kullandılar. PCA verideki en büyük farklılıkları yakalayan yönleri bulurken, ICA örtüşen sinyalleri daha bağımsız parçalara ayırmaya çalışır. Bu indirgenmiş özellik setleri daha sonra bir sayfanın muhtemelen yüksek veya düşük kalitede olup olmadığına karar veren son katmana beslenir. Ekip ayrıca modelin tahminleri belirsiz olduğunda cezalandıran, onu daha net ve daha emin kararlar almaya iten değiştirilmiş bir eğitim kuralını da denedi.

Figure 2
Figure 2.

Sistemin performansı ne kadar iyi

Düşük kaliteli sayfalar yüksek kaliteli olanlardan çok daha fazla olduğundan yazarlar, eğitim örneklerini dengelemek için metni diller arasında ileri geri çevirme gibi çeşitli veri artırma teknikleri kullandılar. Sistemin birçok versiyonunu doğruluk ve F1 puanı gibi standart ölçütlerle ve ayrıca modelin güveninin gerçeğe ne kadar uyduğunu gösteren yeni ölçülerle değerlendirdiler. Öne çıkan tasarım, PCA tabanlı özellik ağırlıklandırmasıyla birleştirilmiş Arapça BERT idi ve yaklaşık %94,7 doğruluğa ulaşarak karşılaştırılabilir görevlerde insan değerlendircilerle aynı seviyede veya onlardan biraz daha iyi performans gösterdi. Tıbbi-özelleştirilmiş model ve entropi tabanlı kayıp gibi diğer versiyonlar ise saf doğruluk ile yüksek/düşük kalite sayfalara verdikleri dengeli muamele veya güveni ifade etme konusunda daha temkinli olma arasında farklı ödünler sundu.

Bu hastalar ve doktorlar için ne anlama gelebilir

Bir sıradan okuyucu açısından ana mesaj, artık Arapça sağlık web siteleri için yetkin değerlendiriciler gibi hareket eden, güvenilir sayfaları öne çıkaran ve şüpheli olanları işaretleyen yapay zeka araçları oluşturmanın mümkün olduğudur. Yazarlar bu tür sistemlerin sağlık profesyonellerinin yerini almaması, onları desteklemesi gerektiğini vurgulasa da, çalışmaları kullanıcıları uyaran tarayıcı eklentileri, güvenilir kaynakları arama sonuçlarında yukarı taşıyan arama motorları veya kullandıkları bilgiyi sessizce filtreleyen sağlık sohbet botları gibi pratik uygulamalara işaret ediyor. Daha fazla test ve güvenlik önlemiyle bu teknikler, savunmasız hastalar ile yanıltıcı çevrimiçi tavsiyeler arasında önemli bir koruma katmanı haline gelebilir.

Atıf: Baqraf, Y., Keikhosrokiani, P. & Cheah, YN. Enhancing trustworthiness of Arabic online health information quality evaluation using an enhanced BERT architecture with PCA and ICA feature weighting. Sci Rep 16, 12434 (2026). https://doi.org/10.1038/s41598-026-43158-8

Anahtar kelimeler: çevrimiçi sağlık bilgisi, Arapça, sağlık yanlış bilgisi, derin öğrenme, BERT