Clear Sky Science · tr

MetaCAM: Ansambl‑tabanlı bir sınıf aktivasyon haritalama çerçevesi olarak model açıklanabilirliğini geliştiriyor

· Dizine geri dön

Yapay zekâ kararlarını içinden görmek neden önemli

Günümüz yapay zekâsı tümörleri tespit edebiliyor, yüzleri tanıyabiliyor ve fotoğrafları insanüstü doğrulukla sınıflandırabiliyor; buna karşın çoğu zaman belirli bir sonuca neden ulaştığını açıklayamıyor. Bu “kara kutu” davranışı, tıp veya otonom sürüş gibi yüksek riskli ortamlarda kaygı vericidir; çünkü kişiler bir tahmini hangi görüntü bölgelerinin gerçekten etkilediğini bilmek ister. Bu makale, görüntü tanıyan bir sinir ağının neye baktığını daha net göstererek YZ kararlarını daha şeffaf ve güvenilir kılmayı amaçlayan, birçok mevcut görselleştirme tekniğini tek bir, daha açık resimde birleştiren yeni bir yöntem olan MetaCAM’i tanıtıyor.

Figure 1
Şekil 1.

Makineler neye “baktıklarını” nasıl gösterir

Görüntü tanımada işin yükünü çeken konvolüsyonel sinir ağları, resimleri birçok katmandan geçirip ardından “kedi” veya “tümör” gibi bir etiket üretir. Sınıf Aktivasyon Haritaları (CAM’ler), bu ağların içine bakmamızı sağlamak için geliştirildi. Bir CAM, orijinal resim üzerine ısı haritası bindirir ve seçilen tahmine en çok katkıda bulunan bölgeleri vurgular. Yıllar içinde, gradyan kullanımından özellik haritalarına ya da görüntü bozulmalarına kadar farklı yaklaşımlar kullanan pek çok CAM çeşidi ortaya çıktı. Ancak performansları tutarsızdır: bir görüntü, sınıf veya model için iyi çalışan bir yöntem başka bir durum için zayıf olabilir ve hangi CAM’in “en iyi” olduğuna dair evrensel bir uzlaşma yoktur.

Daha net ısı haritaları için bir ekip yaklaşımı

Yazarlar, farklı CAM yöntemlerini rakipler yerine bir komitenin üyeleri gibi ele alan MetaCAM’i öneriyor. Tek bir ısı haritasına güvenmek yerine, MetaCAM aynı görüntü ve hedef sınıf için gradyan tabanlı yöntemler, bozulma tabanlı yöntemler ve FullGrad gibi ilgili araçlar dahil olmak üzere çeşitli tekniklerle birden çok harita üreterek başlar. Ardından fikir birliği arar: yöntemler arasında tekrar tekrar vurgulanan pikseller daha güvenilir kabul edilir. Ansamblde en güçlü ve en tutarlı dikkat gören piksellerin yalnızca en üst yüzdesini tutarak, MetaCAM tek bir yöntemin tuhaflıklarından veya başarısızlıklarından daha az etkilenen rafine bir ısı haritası üretir.

Sadece en inandırıcı pikselleri seçmek

Ana yenilik “uyarlanabilir eşikleme”dir; bu, tutulacak en aktif piksel sayısına karar verir. Örneğin her zaman en üst %30’luk pikselleri vurgulamak yerine, yazarlar farklı eşik değerlerini sistematik olarak test eder ve bu pikseller hafifçe bulanıklaştırıldığında ağın tahminlerinin nasıl değiştiğiyle en iyi eşleşeni seçerler. Modelin en “önemli” pikselleri bozulduğunda güvenindeki düşüşü ve en az önemli pikseller bozulduğunda değişimin ne kadar küçük kaldığını ölçen Remove and Debias (ROAD) adlı nicel bir teste dayanırlar. Birçok eşik boyunca tarama yaparak, MetaCAM gerçekten kritik ile büyük ölçüde alakasız bölgeler arasındaki ayrımı en güçlü kılan seviyeyi bulur; aynı fikir bireysel CAM yöntemlerini de kendi başlarına keskinleştirmek için kullanılabilir.

Figure 2
Şekil 2.

Hangi yöntemlerin yardım ettiği—ve hangilerinin şaşırtıcı şekilde yardımcı olduğu keşfi

En iyi MetaCAM’i hangi bileşenlerin oluşturduğunu anlamak için araştırmacılar, CAM yöntem gruplarını farklı kombinasyonlarda açıp kapatarak geniş ölçekli deneyler yürüttü. Yüksek performanslı hesaplama kullanarak, birçok görüntü, sınıf ve sinir ağı mimarisi üzerinde 64 farklı kombinasyonu değerlendirdiler. Ardından her grubun medyan deneye göre performansı ne kadar artırma veya düşürme eğiliminde olduğunu yakalayan Kümülatif Artık Etkisi adlı bir özet istatistik tanıttılar. Şaşırtıcı şekilde, sıklıkla yanlış nesneyi vurgulayan bir CAM veya rastgele gürültüden türetilmiş bir harita gibi “kötü” veya gürültülü haritalar bile bazen MetaCAM’i iyileştirebiliyor; çünkü bu tür haritaların varlığı, fikir birliğinin birden çok yöntem tarafından üzerinde hemfikir olunan piksellere daha sıkı sıkışmasını zorlayarak diğer yerlerdeki rastgele vurguları azaltıyor.

Daha güvenli, daha şeffaf YZ için anlamı

Çeşitli test görüntüleri ve modeller üzerinde, uyarlanabilir eşikleme ile MetaCAM ROAD metriğine göre tutarlı biçimde tüm bireysel görselleştirme yöntemlerinin önüne geçti. Pratik olarak, ısı haritaları bir ağın kararını gerçekten yönlendiren bölgeleri daha kesin işaretlerken, tek yöntemli haritalarda görülen gereksiz karışıklık ve yanıltmaları büyük ölçüde filtreliyor. Bir sistemin “evet” veya “hayır” demesinin nedenini anlamanın cevabın kendisi kadar önemli olabildiği tıbbi görüntüleme, otonom araçlar veya biyometrik tarama gibi alanlar için MetaCAM, uzmanların bir modeli gerçek dünyada güvenmeden önce doğru özelliklere odaklanıp odaklanmadığını değerlendirmesine yardımcı olan daha kararlı, kanıta dayalı bir pencere sunuyor.

Atıf: Dick, K., Kaczmarek, E., Miguel, O.X. et al. MetaCAM as an ensemble-based class activation mapping framework improves model explainability. Sci Rep 16, 10613 (2026). https://doi.org/10.1038/s41598-026-42879-0

Anahtar kelimeler: açıklanabilir YZ, sınıf aktivasyon haritaları, derin öğrenme, model yorumlanabilirliği, ansambl yöntemleri