Clear Sky Science · tr

IMFLKD: bilgi damıtımı temelli merkezsizleştirilmiş federated learning için bir teşvik mekanizması

· Dizine geri dön

Neden Paylaşım Güvenli ve Adil Olabilir

Modern yapay zeka veriye dayanır, ancak verilerimizin çoğu kişisel telefonlarda, hastane sunucularında veya doğrudan kopyalanıp paylaşılamayan şirket bulutlarında bulunur. Federated learning, birçok cihazın ham verilerini açığa çıkarmadan ortak bir modeli eğitmesine izin veren bir yol sunar, ancak günümüz sistemleri hâlâ gizlilik sızıntıları, tek bir arıza noktası ve en çok katkıda bulunanlara adaletsiz ödüller gibi sorunlarla karşılaşıyor. Bu makale, blokzinciri, bilgi damıtımı ve itibar puanlamasını birleştiren IMFLKD adlı yeni bir çerçeveyi tanıtarak bu tür toplu öğrenmeyi daha özel, daha dayanıklı ve uzun vadede daha adil hale getiriyor.

Figure 1
Figure 1.

Sırları Paylaşmadan Birlikte Öğrenmek

Klasik federated learning’de merkezi bir sunucu birçok katılımcıdan model güncellemelerini toplar ve bunları birleştirir. Bu ham verilerin taşınmasını engeller, ancak sunucu kendisi cazip bir hedef haline gelir: başarısız olursa tüm sistem durur, güvenilmezse model güncellemelerindeki bilgiyi kötüye kullanabilir veya sızdırabilir. Yazarlar bunun yerine eğitimi koordine etmek için merkezsiz bir blokzinciri defteri kullanıyor. Her katılımcı kendi verisi üzerinde yerel bir model eğitir ve ardından katkıları kaydeden, bilgileri birleştiren ve ödülleri dağıtan akıllı sözleşmelerle etkileşime girer; tüm bunlar tek bir merkezi otoriteye dayanmaz.

Ağır Modelleri Değil Bilgiyi Paylaşmak

İletişim maliyetlerini azaltmak ve gizliliği daha da korumak için çerçeve bilgi damıtımına dayanır. Tam model parametrelerini göndermek yerine, her katılımcı yalnızca paylaşılan girdiler seti için modelin tahmin ettiği olasılıkları — yani “yumuşak etiketleri” — gönderir; bunlar çok daha hafif olup tek bir kişinin verileri hakkında daha az bilgi açığa çıkarır. Gerçek bir ortak veri kümesi olmayabileceği için sistem, orijinal kayıtları açığa çıkarmadan genel etiket dağılımına kabaca uyan sentetik bir “sahte-kamu” veri kümesi oluşturmak üzere koşullu variational autoencoder adlı bir üretici model kullanır. Katılımcılar kendi verileri üzerinde eğitilir, bu sentetik veri kümesi üzerinde tahminler yapar ve ardından herkesin birleşik bilgisinden türetilen toplulaştırılmış bir sinyal kullanarak modellerini iyileştirirler.

Gerçekten Kim Yardım Ediyor Ölçmek

Herhangi bir işbirlikçi sistemde merkezi bir zorluk, kimin kredi hak ettiğine karar vermektir. IMFLKD bunu etiket toplulaştırmasına dayanan iki aşamalı bir katkı değerlendirme yöntemiyle çözer. İlk olarak, hafif bir Bayesçi algoritma tüm katılımcıların tahminlerini inceler, her örnek için en olası gerçek etiketi ve her model için bir kalite puanı çıkarır ve bu puanları daha fazla görev geldikçe günceller. Bu yaklaşım geçmiş verileri saklamadan çevrimiçi çalışır ve ortaya çıkan konsensüsle sık sık çelişen modellerin ağırlığını azaltarak gürültülü veya kötü niyetli katkıda bulunanları ele alır. Deneyler, bu etiket toplulaştırmasının basit çoğunluk oylamasına kıyasla doğrulukta yaklaşık yüzde 10 iyileşme sağladığını ve kaynak sınırlı, büyük ölçekli ortamlara yeterince hızlı kaldığını gösteriyor.

Kaliteyi Ödüle ve İtibara Dönüştürmek

Katkı kalitesi belirlendikten sonra, IMFLKD bunu ödüllere dönüştürmek için ağırlıklı peer truth serum adlı bir teşvik şeması kullanır. Katılımcılar kalite-ağırlıklı akran konsensüsüne karşı karşılaştırılır: tahminleri yüksek kaliteli akranlarla uyumlu olanlar daha çok kazanırken, sapma gösteren veya sık sık anlaşmazlık yaşayanlar cezalandırılır. Bu, işbirliği durumlarında bile uzun vadede dürüst raporlamayı en karlı strateji haline getirir. Bunların üzerine sistem, her katılımcı için veri kalitesi, etkinlik düzeyi ve davranışsal istikrarı birleştiren çok boyutlu bir itibar puanı oluşturur ve eski davranışı bir zaman-azalma (time-decay) faktörüyle ayarlar. İtibar daha sonra katılımcının tahminlerinin ne kadar ağırlık taşıdığını ve gelecekteki görevler için seçilip seçilmeyeceğini etkileyerek sonraki turlara geri besleme sağlar.

Figure 2
Figure 2.

Toplu Zekâda Güven İnşa Etmek

Genel olarak IMFLKD çerçevesi, birçok bağımsız cihaz arasında verimli, gizliliğe duyarlı ve bedavacılarla saldırganlara karşı dirençli bir şekilde öğrenmeyi koordine etmenin mümkün olduğunu gösteriyor. Sentetik veri üretimi, titiz katkı puanlaması, oyun teorisine dayalı ödüller ve blokzincir üzerinde dinamik itibar takibini harmanlayarak sistem, katılımcıları birçok eğitim turu boyunca dürüst ve tutarlı davranmaya teşvik ediyor. Bir uzman olmayan için çıkarım şu: tıbbi kayıtlar, sensör okumaları veya kişisel cihazlar gibi dağıtık verilerin kolektif gücünden tek bir şirket ya da sunucuya her şeyi vermeden yararlanabiliriz; aynı zamanda en faydalı bilgiyi sağlayanların en çok fayda sağlayacağını garanti edebiliriz.

Atıf: Ying, X., Yan, K., Gao, X. et al. IMFLKD: an incentive mechanism for decentralized federated learning based on knowledge distillation. Sci Rep 16, 10567 (2026). https://doi.org/10.1038/s41598-026-46234-1

Anahtar kelimeler: federated learning, blockchain, bilgi damıtımı, teşvik mekanizmaları, itibar sistemleri