Clear Sky Science · tr

Negatif-sıcak etiket kodlaması ve sınıf ağırlığı maskelenmesi ile özellik açısından ayırt edilemez makine unlearning (unutma)

2026-03-03 · Dizine geri dön

Makinelere unutmayı öğretmenin önemi

Fotoğraf etiketlemeden tıbbi görüntü analizine kadar modern uygulamalar, büyük veri kümeleri üzerinde eğitilmiş güçlü görüntü tanıma sistemlerine dayanır. Peki biri verilerinin silinmesini istediğinde ya da bir veri kümesinin önyargılı veya güvensiz olduğu ortaya çıktığında ne olur? Bugünün sinir ağlarının basit bir “sil” düğmesi yoktur. Bu makale, eğitilmiş bir modelin belirli veri kategorilerini “unutmasını” pratik bir şekilde sağlamayı, geri kalan konulardaki yeteneklerini büyük ölçüde korurken nasıl başarabileceğini sunar.

Veriler yalnızca göz ardı edilmemeli, silinmeli

Avrupa’nın Genel Veri Koruma Yönetmeliği gibi yasalar kişilere “unutulma hakkı” verir; bu, kurumların modellerinden belirli verilerin etkisini yalnızca dosyaları saklamayı bırakmakla kalmayıp gerçekten kaldırması gerektiği anlamına gelir. Her seferinde büyük bir sinir ağını baştan yeniden eğitmek yavaş, maliyetli ve bazen orijinal veriler artık tam olarak mevcut olmadığı için imkansızdır. Mevcut “makine unutma” yöntemleri yardımcı olabilir, ancak genellikle tüm eğitim kümesine erişim gerektirir, ağır matematiksel hesaplamalar içerir veya kalan veriler üzerindeki performansa belirgin zarar verir. Yazarlar hedeflenmiş, verimli ve modelin yararlı bilgisini nazikçe koruyan bir yaklaşım tasarlamayı amaçladılar.

İstenmeyen anıları bulanıklaştırmak için yeni bir tarif

Makalede temel fikir soruna iki düzeyde saldırmaktır: ağın görüntüleri içsel olarak nasıl temsil ettiği ve nihai kararları nasıl verdiği. Temsil düzeyinde yazarlar Negatif-Sıcak Etiket Kodlaması adını verdikleri yeni bir etiketleme yöntemi tanıtıyor. Unutulması gereken kategoriyi güçlendirmek yerine, bu şema onu neredeyse bir “anti-sınıf” gibi ele alır. Kaldırılacak kategoriden yalnızca küçük bir örnek seti kullanılarak yapılan kısa bir ince ayar aşamasında, ağın bu görüntülerin içsel tanımı daha az ayırt edici ve diğer sınıflarla daha karışık hâle gelecek şekilde yönlendirilir. Karar düzeyinde ise, Sınıf Ağırlığı Maskelenmesi eklenir; bu, unutulacak kategoriyle ilişkili modelin son bağlantılarını seçici olarak zayıflatır ve çıktıya olan doğrudan etkisini keser.

Negatif etiketler bir kategoriyi nasıl zayıflatır

Günlük görüntü sınıflayıcıları “one-hot” etiketlerle eğitilir: doğru sınıf vurgulanır, diğerleri sıfırdır. Bu, ağın her kategori için net bir sınır çizmesini sağlar. Negatif-Sıcak Etiket Kodlaması, silmek istediğimiz kategori için bu mantığı tersine çevirir. Unutma sırasında o kategoriye negatif bir katkı verilirken, kalan kategoriler küçük pozitif katkılar alır. Matematiksel olarak bu, unutulan sınıfı bir zamanlar bu kadar ayırt edici yapan gradyan güncellemelerini tersine çevirir ve güçlendirir, böylece özelliklerini yavaşça kalabalığa doğru iter. Ağın içsel özellik uzayının görselleştirmeleri, bu şema altında unutulan sınıfa ait noktaların sıkı, ayrı bir küme oluşturmaktan vazgeçtiğini ve bunun yerine diğer sınıfların çevresindeki buluta karıştığını gösterir.

Kalanları korurken karar bağlantılarını kesmek

Sadece etiketleri değiştirmek yeterli değildir, çünkü ağın erken katmanlarını ayarlamak diğer kategorilerin tanınma şeklini istemeden bozabilir. Sınıf Ağırlığı Maskelenmesi doğrudan ve maliyetsiz bir koruma sağlar. Negatif etiketlerle yapılan kısa ince ayardan sonra yöntem, son sınıflandırıcı katmanda unutulan kategoriyle en çok ilişkilendirilen model bileşenlerini belirler ve susturur. Bu adım, tüm eğitim örneklerine erişim veya karmaşık küresel hesaplamalar gerektirmeden modelin o kategoriyi seçme yeteneğini keskin biçimde azaltır. İki adım birlikte NHLE–CWM çerçevesini oluşturur: ilki özellik uzayında istenmeyen anıyı bulanıklaştırır, ikincisi kararlar üzerindeki kalan etkisini keser ve her ikisi de kaldırılacak sınıflardan yalnızca küçük bir örnek sayısı kullanılarak ayarlanır.

Görüş benchmark’larında çok sayıda testten kanıt

Yazarlar çerçevelerini el yazısı rakamlar, sokak görünümü ev numaraları, giysi görüntüleri ve renkli nesne fotoğrafları da dahil olmak üzere birkaç tanınmış görüntü veri kümesi üzerinde, çeşitli popüler sinir ağı mimarileri kullanarak test etti. Tek sınıf ve çok sınıflı unutma senaryolarının her ikisinde de yöntem, unutulan sınıflardaki doğruluğu neredeyse sıfıra düşürdü ve modelin bunları tanımasını pratik olarak imkânsız hâle getirdi. Kritik olarak, korunacak sınıflardaki doğruluk en fazla birkaç puan düştü ve bazı durumlarda hafifçe iyileşti. Önde gelen unutma yöntemleriyle yapılan karşılaştırmalar, bu yeni yaklaşımın kalan performansa daha az zarar vererek daha güçlü unutma sağladığını, üstelik unutulacak sınıflardan yalnızca küçük bir örnek seti gerektirdiğini ve ağır hesaplamalardan kaçındığını gösterdi.

Günlük yapay zekâ için anlamı

Basitçe ifade etmek gerekirse bu çalışma, belirli türdeki veriler için kontrol edilebilir bir “bellek silgisi” ile sinir ağlarını sonradan donatmanın mümkün olduğunu gösteriyor. Etiketlerin kısa bir yeniden eğitim adımı sırasında nasıl kullanıldığını akıllıca değiştirerek ve hedeflenmiş karar ağırlıklarını maskeliyerek, NHLE–CWM çerçevesi modelin unutulan kategoriyi hem bulanık hem de etkisiz görmesini sağlıyor. Kullanıcılar ve düzenleyiciler için bu, değerli modelleri atmak zorunda kalmadan unutulma hakkını uygulamaya yönelik daha gerçekçi bir yol demek. Uygulayıcılar içinse önyargılı, güncelliğini yitirmiş veya hassas sınıfları sistemin geri kalanını koruyarak kaldırmaya yönelik ölçeklenebilir ve hesaplama açısından hafif bir araç sunuyor.

Atıf: Wang, J., Bie, H., Jing, Z. et al. Feature-indistinguishable machine unlearning via negative-hot label encoding and class weight masking. Sci Rep 16, 11879 (2026). https://doi.org/10.1038/s41598-026-40379-9

Anahtar kelimeler: makine unutma, veri gizliliği, derin öğrenme, görüntü sınıflandırma, model unutması