Clear Sky Science · tr

Kazanımların ve ödül geçmişinin belirsizlikle ilişkili etkileri: kazançlar ve kayıplardan sonra kararlar üzerindeki ayrık etkiler

· Dizine geri dön

Neden kazançlar ve kayıplar bize eşit şekilde öğretmiyor

Günlük hayatımızda bir hisse senedini seçmekten işe gidiş rotasını belirlemeye kadar geçmişteki kazançlar ve kayıplara dayanarak kararlar alırız. Yine de insanlar ve hayvanlar başarıdan başarısızlıktan daha fazla öğrenme eğilimindedir. Bu makale, bu dengesizliğin yalnızca bir tuhaflık olmadığını, beynimizin ödül geçmişini ve belirsizliği nasıl izlediği tarafından şekillenen uyarlanabilir bir strateji olduğunu araştırıyor. Araştırmacılar değişken, kısmen öngörülemez bir ortamda sıçanları inceleyerek, kazançların kayıplardan ne zaman daha fazla önem taşıdığını ve bu kuralların erkekler ve dişiler arasında nasıl farklılık gösterdiğini ortaya çıkaran gizli kuralları açığa çıkarıyor.

Figure 1
Figure 1.

Susuz sıçanlar için değişen bir dünya

Bu kuralları araştırmak için ekip suya kısıtlanmış sıçanları dinamik bir seçim görevinde eğitti. Her denemede sıçanlar bir turu başlattı, ardından iki kol arasından birini seçti. Bir kol şekerli sudan bir damla verme olasılığı daha yüksekti, ancak hangi kolun “daha iyi” olduğu ve ne kadar daha iyi olduğu oturum boyunca bloklar halinde değişiyordu. Bazı bloklar daha iyi kolu çok belirgin kıldı (bir taraf çoğu zaman ödül verirken, diğeri neredeyse hiç), diğer bloklar ise daha kafa karıştırıcıydı; iki kolun ödül olasılıkları yakın ya da hatta eşit olabiliyordu. Bu sürekli değişen düzen, dün işe yarayanın bugün işe yaramayabileceği gerçek yaşamı taklit ediyor.

Kazananlara bağlı kalmak, bazı kayıpları umursamamak

Yüzlerce oturum boyunca sıçanlar bir kazançtan sonra bir seçimi tekrarlama eğilimindeydi (“kazanın-dursa”) ve kayıptan sonra değiştirme (“kaybet-değiştir”) olasılığı daha düşüktü. Bu, başarıdan öğrenmeye güçlü bir eğilim doğruladı. Bu desen, sıçanların bir blok içinde hangi kolun genellikle daha iyi olduğunu anlamaya zaman ayırdıkça özellikle belirgindi. Bu daha sonraki denemelerde, kazançlardan sonra daha sık kalmakla kalmayıp nadir bir kayıptan sonra daha iyi koldan vazgeçme olasılıkları da azaldı. Bu strateji, iyi bir seçime rağmen ara sıra kötü bir sonuç meydana geldiğinde yanıltılmak yerine daha ödüllendirici seçeneği kullanmaya devam etmelerine yardımcı oldu. Erkeklerde bu eğilim dişilere göre daha güçlüydü: erkekler kazançlardan sonra kalma ve kayıplardan sonra değişme olasılığı açısından daha belirgindi.

Gizli sinyaller: belirsizlik ve ödül geçmişi

Bu davranışın arkasındaki görünmez hesaplamaları anlamak için yazarlar pekiştirme öğrenmesi modelleri kullandılar—geri bildirime dayanarak beklentileri güncelleyen bilgisayar algoritmaları. İki iç sinyale odaklandılar. Birincisi “belirsizlik geçmişi” ölçüsüydü: son sürpriz seviyelerinin ortalaması, sonuçların ne kadar öngörülemez olduğunu yakalıyordu. Bu sayı yüksek olduğunda ortam etkili bir şekilde daha bulanıktı. İkincisi ise “küresel ödül durumu”ydu; son dönemde ortamın genel olarak ne kadar zengin ya da yoksun hissettirdiğinin pürüzsüzleştirilmiş bir özeti. Bu iki sinyal birlikte sıçanların dünyanın ne kadar gürültülü olduğunu ve son zamanlarda işlerin ne kadar iyi gittiğini tahmin etmelerini, ayrıca en son kazanca veya kayba ne kadar ağırlık vereceklerini ayarlamalarını sağladı.

Figure 2
Figure 2.

Öngörülemezlik ve bolluk seçimleri nasıl şekillendiriyor

İki iç sinyal davranışı ayrı ve bazen cinsiyete özgü biçimlerde etkiledi. Belirsizlik düşük olduğunda—yani ortamın örüntüsü daha net olduğunda—sıçanlar bir kazançtan sonra kalma ve daha iyi koldan vazgeçmeme olasılığı daha yüksekti. Yüksek belirsizlik altında, iyi bir koldan bir kayıp sonra uzaklaşmaya daha eğilimliydiler; bu, kafa karıştırıcı koşulların daha temkinli davranışı tetikleyebileceğini gösteriyor. Bu arada genel olarak iyi bir ödül dizisini yansıtan yüksek küresel ödül durumu, sıçanları kazançlardan sonra kalmaya teşvik etti ve ortam bir miktar gürültülü olsa bile kayıplardan sonra değişme eğilimlerini azalttı. Erkeklerin kazanca dayalı kararları özellikle belirsizlik geçmişlerinden etkilendi, oysa dişiler daha tutarlı biçimde genel ödül durumuna güvendiler.

Günlük kararlar için bunun anlamı

Bir okur için ana mesaj şudur: “kazançlardan kayıplardan daha fazla öğrenmek” yalnızca aşırı iyimser olmak değildir. Çalışma, sıçanların—muhtemelen insanların da—kazançlara ve kayıplara ne kadar kulak vereceklerini son zamanlarda dünyalarının ne kadar öngörülebilir ve ne kadar ödüllendirici hissettiğine göre dinamik olarak ayarladıklarını gösteriyor. Kurallar net ve ödüller bol olduğunda, kazançlara güvenmek ve ara sıra başarısızlıkları göz ardı etmek akıllıca olabilir. İşler kaotik veya kıt görünüyorsa, kayıplara daha fazla önem vermek kötü seçimlerden kaçınmaya yardımcı olabilir. Bu çalışma ayrıca erkekler ve dişilerin aynı görev kurallarını belirsizlik ve ödül geçmişinin biraz farklı iç dengeleriyle izleyebileceğini ortaya koyuyor; bu içgörü, ödül ve cezadan öğrenmenin bozulduğu bağımlılık veya depresyon gibi durumlara yatkınlıktaki cinsiyet farklılıklarını açıklamaya yardımcı olabilir.

Atıf: Kalhan, S., Magnard, R., Zhang, Z. et al. Uncertainty and reward histories have distinct effects on decisions after wins and losses. Sci Rep 16, 6795 (2026). https://doi.org/10.1038/s41598-026-37554-3

Anahtar kelimeler: pekiştirme öğrenmesi, karar verme, belirsizlik, ödül geçmişi, cinsiyet farklılıkları