Clear Sky Science · tr

Minimal çoğunluk oyu yorumlanabilir toplulukların kararlılığı ve dayanıklılığı

· Dizine geri dön

Neden küçük oylama modelleri önemli

Bilgisayarlar kimin kredi alacağına, hangi tıbbi testin yapılacağına veya dolandırıcılığın nasıl taranacağına yardımcı olduğunda, insanlar her kararın ardındaki nedenleri anlamak ister. Yaygın bir yaklaşım, cevaba oy veren basit evet/hayır kurallarından oluşan çok küçük modeller kullanmaktır. Bu modeller okunması kolaydır, ancak bu makalenin dayandığı çalışma daha derin bir soruyu gündeme getiriyor: en küçük mümkün kural kümesini zorlayınca, açıklamalar veri değişince kolayca kırılganlaşıp değişir mi?

Basit kural oy verenler sade dille

Makale, çoğunluk oyu toplulukları olarak bilinen küçük kural tabanlı sistemleri inceliyor. Her kural bir eşikten büyük olup olmamak gibi tek bir evet/hayır özelliğine bakar ve iki sonuçtan birine oy verir. Nihai karar bu oyların çoğunluğundan çıkar. Yazarlar, eğitim verisine uymak için gereken en az sayıda kuralı kullanan minimal modelleri inceliyor. Bu tür modeller açıklanabilirlik için çok çekicidir, çünkü bir insan, prensipte, tüm kuralları okuyabilir ve kararların nasıl alındığını anlayabilir.

Çok sayıda farklı en küçük çözüm

Ancak gerçek veriler genellikle birden fazla en küçük modeli mümkün kılar. Ekip, aynı veriye mükemmel şekilde uyan birçok farklı minimal kural kümesi olabileceğini gösteriyor; bu durum bazen Rashomon etkisi olarak adlandırılıyor. Bunu incelemek için üç ölçüm öneriyorlar. Birincisi, çokluk oranı bir veri seti için birden fazla minimal modelin olma sıklığını sayar. İkincisi, bootstrap kararlılığı veriler hafifçe yeniden örneklendiğinde seçilen minimal modellerin ne kadar benzer olduğunu kontrol eder. Üçüncüsü, özellik-değiştirme dayanıklılığı, bireysel giriş bitleri rastgele çevrildiğinde seçilmiş bir modelin ne kadar ayakta kaldığını sınar; bu, gürültülü veya kaymış veriyi taklit eder.

Figure 1. Karmaşık verilerden birlikte anlaşılabilir bir karar veren kompakt bir oylama kuralı kümesine dönüştürme.
Figure 1. Karmaşık verilerden birlikte anlaşılabilir bir karar veren kompakt bir oylama kuralı kümesine dönüştürme.

Dikkatli deneylerin ortaya koydukları

Kontrollü sentetik veri setleri kullanarak yazarlar bilinen bir oylama modelini yerleştirip sonra küçük örneklerden minimal modelleri kurtarmaya çalışıyor. Temiz test verisindeki doğruluk, kararlılık zayıf olsa bile yüksek olabiliyor. Çok az eğitim örneğiyle birçok farklı minimal model ortaya çıkıyor ve bir yeniden örneklemeden diğerine seçilen kural kümeleri yalnızca sınırlı ölçüde örtüşüyor. Örnek sayısı arttıkça bu kararsızlıklar küçülüyor: çokluk azalıyor, bootstrap kararlılığı yükseliyor ve özellik-değiştirme dayanıklılığı iyileşiyor. Orta düzey örnek sayılarında kurtarılan minimal model neredeyse yerleştirilen modelle eşleşiyor ve daha fazla veri toplamak yalnızca küçük kazançlar sağlıyor.

Gerçek veri setleri ve pratik tercihler

Araştırma daha sonra kanser tanısı ve banknot doğrulaması gibi alanlardan klasik makine öğrenimi veri setlerine yöneliyor. Küçük kural kümeleriyle mükemmel uyum her zaman mümkün olmadığından, yazarlar hedefi seçilen bir eğitim doğruluğuna en azından ulaşmak üzere gevşetiyor ve sonra bu eşiği karşılayan en küçük modelleri arıyorlar. Bazı veri setlerinin çok kararlı minimal toplulukları desteklediğini, bazılarının ise net kararsızlık ve gürültüye duyarlılık gösterdiğini buluyorlar. Gerekli doğruluk sıkılaştırıldıkça modeller daha az kararlı hale geliyor ve bazen bulunması imkânsız oluyor. Bunu ele almak için yazarlar, hâlâ küçük modelleri tercih eden ama tüm minimal modeller arasından bootstrap yeniden örneklemelerde en sık görünenleri veya özellik-değiştirmelere en dayanıklı olanları seçen seçim kurallarını test ediyor. Bu stratejiler ham doğruluktan biraz ödün vererek daha tekrarlanabilir ve güvenilir açıklamalar sağlıyor.

Figure 2. Verideki küçük değişiklikler farklı küçük oylama-kuralı kümelerini seçer ve daha kararlı modeller tercih edilmediği sürece kararları değiştirir.
Figure 2. Verideki küçük değişiklikler farklı küçük oylama-kuralı kümelerini seçer ve daha kararlı modeller tercih edilmediği sürece kararları değiştirir.

Yüksek riskli kararlar için bunun önemi

Hassas alanlarda şeffaf modellere güvenenler için temel mesaj şudur: "en küçük" her zaman "en güvenli" anlamına gelmez. İki aynı derecede küçük kural kümesi, bir kararın neden verildiği hakkında farklı hikâyeler anlatabilir ve girişlerdeki küçük değişikliklere farklı tepki verebilir. Yazarlar, bu tür modellerin ne kadar kararlı ve dayanıklı olduğunu ölçmenin pratik olduğunu ve model boyutunun yanında bu ölçümlerin raporlanmasının açıklamaların kırılgan olduğu durumlarda kullanıcıları uyarmaya yardımcı olacağını gösteriyor. Özetle, yüksek riskli kararlar için basit oylama modelleri oluştururken önce kompaktlığa odaklanılmalı, ardından yeniden örneklenen veya hafifçe bozulmuş verilerde tutarlı davranan sürümler kasıtlı olarak tercih edilmelidir.

Atıf: Li, Q., Huang, Z. & Pan, M. Stability and robustness of minimal majority vote interpretable ensembles. Sci Rep 16, 14877 (2026). https://doi.org/10.1038/s41598-026-45289-4

Anahtar kelimeler: yorumlanabilir modeller, çoğunluk oyu, model kararlılığı, dayanıklılık, Rashomon etkisi