Clear Sky Science · tr
Beyin esinli rastgele gürültü ile ısınma eğitimi ile belirsizlik kalibrasyonu
Akıllı YZ neden hata yapabileceğini bilmek zorunda
Modern yapay zeka sistemleri görüntüleri tanıma, araç kullanma ve doğal dilde sohbet etme gibi görevleri etkileyici bir yetenekle yerine getirebiliyor. Yine de tehlikeli bir kör noktaları sıkça bulunuyor: son derece emin görünürlerken tamamen yanlış olabilirler. Bu güven ile doğruluk arasındaki uyumsuzluk kötü tıbbi kararlar, güvenli olmayan otonom sürüş davranışları veya ikna edici şekilde uydurulan gerçeklerle dolu sohbet botlarına yol açabilir. "Beyin esinli rastgele gürültü ile ısınma eğitimi ile belirsizlik kalibrasyonu" başlıklı makale, YZ modellerine insan benzeri hayati bir alışkanlığı öğretmenin şaşırtıcı derecede basit ve biyolojik olarak esinlenmiş bir yolunu araştırıyor: gerçekten bilmediklerinde belirsizliği ifade etmeyi öğrenmek.

Güven ve gerçeklik ne zaman ayrışır
Yazarlar önce günümüzün sinir ağlarının nasıl güven bildirdiğini inceliyor. Doğal görüntüler üzerinde eğitilen bir sınıflandırıcı yalnızca gördüğünü tahmin etmekle kalmaz, aynı zamanda verdiği cevabın doğru olma olasılığını da tahmin eder. İdeal olarak model %80 güven gösteriyorsa yaklaşık %80 doğru olmalıdır. Gerçekte ise, araştırmacılar ağlar derinleştikçe ve sınırlı verilerle eğitildikçe güvenlerinin şiştiğini gösteriyor: sıklıkla yanlış yanıtlar için çok yüksek kesinlik atfederler. Bu sorun, model eğitimde hiç görmediği görüntülerle karşılaştığında—dağılım dışı veri olarak bilinen durum—daha da kötüleşir; burada hâlâ aşırı emin davranır, belirsizliği kabul etmez.
Gelişen beyinden alınan bir ısınma
Bunu ele almak için çalışma biyolojiye bakıyor. Doğumdan önce hayvan beyinleri zaten aktiftir; anlamlı görüntü ve sesler gelmeden çok önce spontan elektriksel etkinlik desenleri ateşler. Sinirbilimciler bu erken "gürültünün" devreleri gerçek duyusal deneyime hazır hale getirmeye yardımcı olduğunu düşünüyor. Bunun esinlendirdiği şekilde yazarlar yapay ağlar için bir ısınma aşaması öneriyor: modele herhangi bir gerçek görüntü veya etiket gösterilmeden önce, tamamen rastgele giriş desenleri ile rastgele, anlamsız etiketler eşleştirilerek kısa süreyle eğitiliyor. İlk bakışta bunun anlamsız olduğu düşünülebilir—ağ saf gürültüden faydalı bir şey öğrenemez. Ancak bu kısa aşama sırasında, içsel tepkileri, çıktılarının olasılıklarının eşit şekilde dağılmış olduğu bir duruma yerleşir; yani aşırı özgüvenden ziyade saf şansa karşılık gelir.

Rastgele gürültü güveni nasıl dürüst kılar
Basitleştirilmiş oyuncak modeller ve tam görüntü sınıflandırıcıları kullanarak araştırmacılar bu ısınmanın kaputun altında ne yaptığını gösteriyor. Standart rastgele başlatılmış bir ağda, son karar katmanından hemen önceki matematiksel sinyaller genellikle büyük oynaklıklar gösterir; bu da softmax fonksiyonunun bunları sıfır ya da bire yakın aşırı olasılıklara dönüştürmesiyle sonuçlanır. Bu, eğitilmemiş bir modelin hiçbir şey bilmediği halde çok emin davranması demektir. Rastgele gürültü üzerinde yapılan eğitim, bu iç sinyalleri nazikçe yeniden ölçeklendirir ve çıktının olasılıklarının şans düzeyine yakın bir aralıkta kümelenmesini sağlar. Ağırlıklar neredeyse değişmez; bunun yerine etkinlik düzeni "ön-kalibre" edilir, böylece gerçek öğrenme başlamadan önce model yabancı girdiler hakkında doğal olarak maksimum belirsizlik ifade eder.
Gerçek ve bilinmeyen veride daha iyi davranış
Bu beyin esinli ısınma tamamlandığında, aynı ağlar standart yöntemlerle gerçek görüntü veri setleri üzerinde eğitilir. Basit ileri beslemeli ağlardan popüler ResNet, DenseNet ve vision transformer modellerine kadar birçok mimaride, gürültüyle eğitilmiş ağlar öğrenme boyunca güven ile gerçek doğruluk arasında daha yakın bir uyum korur. Standart test setlerinde geleneksel başlatılmış ağlarla en az aynı performansı gösterir veya biraz daha iyi olurken, güven skorları çok daha güvenilirdir. Kritik olarak, gerçekten tanımadıkları görüntüler gösterildiğinde bu ön-kalibre edilmiş modeller şansa yakın düşük güven atfeder; bunları kendinden emin şekilde yanlış etiketlemezler. Bu basit özellik, bir girdinin "bilinmeyen" olduğunu tespit etme yeteneklerini önemli ölçüde iyileştirir—doğada güvenli dağıtım için temel bir gereklilik.
Daha güvenilir YZ için temeller
Basitçe söylemek gerekirse çalışma, rastgele gürültü üzerinde çok kısa ve ucuz bir ısınmanın sinir ağlarına baştan bir tür alçakgönüllülük öğretebileceğini gösteriyor. Aşırı kendinden emin tahminciler olarak başlamaktansa, modeller bilmediklerini itiraf ettikleri temkinli bir durumda başlar ve yalnızca gerçek kanıt biriktirdikçe güvenlerini artırırlar. Bu yaklaşım ek işlem adımlarından kaçınır, birçok model türü ve veri boyutunda işe yarar ve biyolojik beyinlerin doğumdan önce kendilerini nasıl hazırladığına da yankı yapar. Geniş çapta benimsenirse, böyle beyin esinli ısınma eğitimi YZ sistemlerinin yalnızca doğru değil, aynı zamanda kendi sınırlarının da farkında olmalarını sağlamaya yardımcı olabilir—günlük karar verme süreçlerinde onları daha güvenli ve daha güvenilir ortaklar haline getirmenin önemli bir adımı.
Atıf: Cheon, J., Paik, SB. Brain-inspired warm-up training with random noise for uncertainty calibration. Nat Mach Intell 8, 602–613 (2026). https://doi.org/10.1038/s42256-026-01215-x
Anahtar kelimeler: belirsizlik kalibrasyonu, sinir ağları, rastgele gürültü ısınması, dağılım dışı tespit, beyinden esinlenen YZ