Clear Sky Science · tr

Eğitim hızı ve doğruluğu dengeli bulaşıcı hastalık tahmin modelleri için veri gizliliği koruma yöntemi

2026-02-05 · Dizine geri dön

Sağlık verilerini korumak neden hâlâ önemli

Hastaneler ve sağlık kurumları artık grip, COVID-19 ve diğer enfeksiyon salgınlarını günler ya da haftalar öncesinden tahmin etmek için yapay zekâya dayanıyor. Bu öngörüler aşı kampanyaları, personel planlaması ve acil durum hazırlıkları için yol gösterici olabiliyor. Ancak tahminleri doğru kılan ayrıntılı hasta kayıtları aynı zamanda son derece hassastır. Yasalar ve kamusal endişe verilerin kurumlar arasında toplanmasını sıklıkla engelliyor; bu da bu modellerin gücünü azaltıyor. Bu çalışma, her hastanenin verisini sahada güvenli şekilde kilitli tutarken yüksek kaliteli bulaşıcı hastalık tahmin sistemleri eğitmenin bir yolunu tanıtıyor.

Grafik paylaşmadan çok sayıda hastaneden öğrenmek

Yazarlar, birkaç hastanenin ortak bir tahmin modelini birlikte eğittiği federated learning (dağıtık eğitim) adlı bir teknik üzerine inşa ediyor. Ham hasta kayıtlarını merkezi bir sunucuya kopyalamak yerine, her site modeli yerel olarak eğitiyor ve yalnızca modelin iç ayarlarına ilişkin sayısal güncellemeleri geri gönderiyor. Bir merkezi sunucu bu güncellemeleri birleştirip iyileşmiş modeli tekrar gönderiyor. Bu döngü birçok kez tekrarlanıyor. Teoride federated learning gizliliği korur çünkü kişisel bilgiler binadan hiç çıkmaz. Pratikte ise zeki saldırganlar paylaşılan güncellemelerden temel veriler hakkında zaman zaman çıkarım yapabiliyor; bu yüzden ek koruma gerekli.

Zekice şifrelemeyle sayıları kilitlemek

Güvenliği güçlendirmek için ekip, şifrelenmiş sayılar üzerinde doğrudan hesaplamalara izin veren bir dijital kilit biçimi olan homomorfik şifreleme kullanıyor. Bu tür geleneksel şemalar çok güvenli olmakla birlikte ünlü şekilde yavaş ve veri-yoğun olabilir; bu da Uzun Kısa Süreli Bellek (LSTM) ağları gibi büyük, karmaşık modellerle kullanımı zorlaştırır. Araştırmacılar modelin farklı bölümlerini farklı şekilde ele alan bir hibrit şema tasarlıyor. En çok açığa çıkaran bileşenler güçlü ama ağır bir şifrelemeyle korunurken, daha az hassas kısımlar daha hafif ve hızlı bir kilit kullanıyor. Bunun üzerinde, hangi eğitim turunda sitelerin gerçekten şifrelenmiş güncellemeler göndereceğini önceden belirlenmiş rastgele bir program karar veriyor; bu sayede gereksiz iletişim atlanabiliyor. Testler, bu kombinasyonun ağır şifrelemenin her yerde kullanıldığı durumda göre eğitimi yaklaşık %25 hızlandırdığını ve verileri güçlü kriptografik varsayımlar altında koruduğunu gösteriyor.

Gerçekten önemli olan güncellemeleri göndermek

Daha akıllı kilitleme olsa bile modeldeki her küçük değişimi kurumlar arasında göndermek zaman ve ağ bant genişliği israfıdır. Bu nedenle yazarlar, Veri Seçimi–Dağıtık Seçim Stokastik Gradyan İnişi (DS-DSSGD) adında yeni bir eğitim kuralı öneriyor. Eğitim sırasında algoritma, modelin her bölümünün bir adımdan diğerine ne kadar değiştiğini ölçüyor. Önceden belirlenmiş bir eşiği aşan yalnızca güncellemeler iletiliyor; küçük, düşük etkili değişiklikler ise basitçe görmezden geliniyor. Aynı zamanda algoritma, en büyük ve en bilgilendirici değişikliklerden hangi veri noktalarının sorumlu olduğunu izliyor. Bu etkili kayıtlar, son bir eğitim turu için rafine edilmiş bir veri kümesine toplanıyor. Yichang Şehri'nden üç yıllık gerçek enfeksiyon raporlarıyla ve yerel web arama trendleriyle yapılan deneyler, DS-DSSGD'nin birkaç standart yönteme kıyasla eğitim süresini yaklaşık %10 azalttığını ve öngörü doğruluğunda anlamlı bir kayıp olmadığını gösteriyor.

Güvenli işbirliği için pratik bir platform

Teknik ilerlemeler yalnızca hastaneler ve laboratuvarlar bunları gerçekten kullanabiliyorsa önem taşır. Bu boşluğu kapatmak için ekip yöntemlerini Yi Shu Fang XDP Privacy Security Computing Platform adlı gerçek bir bilgi işlem ortamına entegre ediyor. XDP sağlık verilerinin toplanmasından temizlenmesine, şifreli analizine ve sonuçların paylaşılmasına kadar tüm yolculuğunu yönetiyor. İstatistikçiler, biyoinformatik uzmanları ve klinisyenler tarafından kullanılan tanıdık araçları destekliyor ve farklı kurumlardan araştırmacıların ham verileri hiçbir zaman indirmeden kontrol edilen bir çalışma alanı içinde işbirliği yapmasına olanak tanıyor. Bu platform içinde hibrit şifreleme şeması ve DS-DSSGD algoritması takılabilir bileşenler olarak çalışıyor ve kuramsal çerçeveyi çalışan bir sisteme dönüştürüyor.

Gelecekteki salgın tahmini için bunun anlamı

Günlük terimlerle, bu çalışma bulaşıcı hastalık tahmini için “iki işi birden yapmanın” mümkün olduğunu gösteriyor: hasta gizliliğini korurken aynı zamanda birçok kuruluştan elde edilen veriler üzerinde hızlı ve doğru modeller eğitmek. Modelin farklı bölümlerini doğru güç düzeyinde şifreleyerek, yalnızca gerektiğinde güncellemeleri göndererek ve her şeyi güvenli bir işbirliği platformunun içine sararak yazarlar gizliliğin maliyetini ezici bir yükten yönetilebilir bir gider haline getiriyor. Geniş çapta benimsenirse, bu tür yaklaşımlar hastanelerin ve halk sağlığı kurumlarının bireysel tıbbi kayıtları asla ifşa etmeden bilgilerini birleştirerek bir sonraki salgına karşı ortak hareket etmesine izin verebilir.

Atıf: Wang, X., Jiang, Y., Pan, G. et al. A data privacy protection method for infectious disease prediction models with balanced training speed and accuracy. Sci Rep 16, 7415 (2026). https://doi.org/10.1038/s41598-026-38906-9

Anahtar kelimeler: bulaşıcı hastalık tahmini, sağlık verisi gizliliği, federated learning, homomorfik şifreleme, derin öğrenme