Clear Sky Science · tr

Çözüm verimliliğinin ve talimatların olumlu/olumsuz yönünün insanlarda, GPT-4 ve GPT-4o’da ekleyici ve çıkarıcı çözüm stratejilerine etkisi

· Dizine geri dön

Daha az yapmak neden şaşırtıcı derecede zor

Günlük hayatta bir şeyi düzeltmeye çalıştığımızda—bir e-postayı yeniden yazmak, bir odayı yeniden düzenlemek, bir politikayı tasarlamak—genellikle ne ekleyeceğimizi düşünürüz, neyi çıkaracağımızı değil. Bu sessiz eğilim, eklemeye yönelme, hayatımızı gereksiz eşyalarla, şişkin yazılımlarla ve aşırı karmaşık kurallarla doldurabilir. Makale, bu “daha fazlası daha iyidir” alışkanlığının ne kadar güçlü olduğunu ve GPT-4 ve GPT-4o gibi yeni yapay zekaların bu insan yanlılığını paylaşıp paylaşmadığını, hafiflettiğini ya da daha da yoğunlaştırıp yoğunlaştırmadığını inceliyor.

Figure 1
Figure 1.

Zihinlerimizde eklemenin çıkarmaya üstün gelmesi

Psikologlar, insanların çıkarma içeren çözümleri sıklıkla göz ardı ettiğini, oysa çıkarma daha basit veya daha etkili olabileceğini gösterdi. Eklemek doğal gelir ve kültür ile dille pekiştirilir: “daha fazla” ve “daha yüksek” gibi sözcükler gelişme ve başarı ile ilişkilendirilirken, “daha az” kayıp veya başarısızlık gibi algılanabilir. Bu önyargı, zararlı alışkanlıkları bırakmaktan ziyade ek tedavilere yönelen sağlık hizmetlerinden, atık üretimini azaltmak yerine geri dönüşümü vurgulayan çevre politikalarına kadar pek çok alanda görülür. Mevcut araştırma, bu insan eğiliminin geniş metin koleksiyonları üzerinde eğitilmiş güçlü dil modellerinde de ortaya çıkıp çıkmadığını sorguluyor.

İnsanları ve yapay zekâyı basit bulmacalarla test etmek

Araştırmacılar, insan katılımcıları önce GPT-4 ile, ardından onun varisi GPT-4o ile karşılaştıran iki büyük çalışma yürüttü. Hem insanlar hem de yapay zekâ iki tür problemle karşılaştı. Bir uzamsal “simetri” görevinde, küçük bir ızgara desenini kutuları açıp kapatarak mükemmel simetriye kavuşturmaları gerekiyordu; bu ya ekstra kutuları doldurarak (ekleme) ya da mevcut kutuları temizleyerek (çıkarma) yapılabilirdi. Bir dilsel “özet” görevinde ise katılımcılara bir haber makalesi ve mevcut bir özet verildi; kelime sayısı kısıtları altında ya ekleme ya da kesme yapmaları istendi. Ekip ayrıca iki ana faktörü manipüle etti: ekleme ile çıkarmanın eşit verimlilikte olup olmadığı ya da çıkarmanın açıkça daha az adım gerektirip gerektirmediği, ve talimatların nötr (“değiştir”) mı yoksa olumlu bir tonla (“iyileştir”) mı ifade edildiği.

Figure 2
Figure 2.

İnsanların yaptığı ile makinelerin yaptığı arasındaki fark

Her iki çalışmada da belirgin bir desen ortaya çıktı: insanlar ve dil modelleri ekleyici çözümleri tercih etti, ancak modeller bunu çok daha güçlü şekilde yaptı. İnsanlar kutu veya kelime eklemeye doğru güçlü bir eğilim gösterirken yine de verimliliğe dikkat ediyorlardı. Çıkarma daha hızlı yol olduğunda, öğeleri kaldırmaya daha istekli davrandılar. Buna karşılık, GPT-4 çoğu kez tam tersi biçimde davrandı—çıkarma daha verimli olacağı durumlarda bile daha fazla ekleyici yanıtlar üretti. GPT-4o, metin tabanlı özet görevinde bu uyumsuzluğu bir ölçüde azalttı; seçimleri insan davranışını daha yakın takip etti, ancak ızgara görevinde hâlâ büyük ölçüde verimliliği görmezden geldi. Pek çok koşulda, özellikle GPT-4o için, ekleyici yanıtlar neredeyse tavan seviyelere ulaştı.

Olumlu sözcüklemenin seçimleri nasıl iteceği

Talimatların duygusal tonu da önem taşıdı, ancak belirli şekillerde. Uzamsal ızgara görevinde, fiilin nötr (“değiştir”) olmaktan olumluya (“iyileştir”) değiştirilmesi ne insanlar ne de modeller için stratejileri güvenilir şekilde değiştirmedi. Özet görevinde ise durum farklıydı. Talimatlar tekrarlı olarak olumlu sözlerle verildiğinde, hem GPT modelleri hem de ikinci çalışmada insan katılımcılar daha fazla ekleyici yanıt üretti. Bu, iyileştirme ile ilgili sözcüklerin çıkarma yerine eklemeyle daha sık eşleştirildiğini gösteren geniş dil istatistikleriyle uyumludur. Bu, istemlerdeki ince duygusal çerçevenin hem insanları hem de yapay zekâyı “daha fazlası”na itebileceğini, oysa “daha az”ın yeterli olacağı durumlar olduğunu düşündürüyor.

Bu bulguların günlük kararlar için neden önemi var

Günlük okur için önemli mesaj şudur: beynimiz ve inşa ettiğimiz yapay zekâlar, ekleme yönünde güçlü bir tercih paylaşıyor—ve mevcut dil modelleri genellikle bu eğilimi güçlendiriyor. İnsanlar hâlâ bazı esneklikler gösteriyor ve çıkarma açıkça daha verimli olduğunda uyum sağlayabiliyorlar, ancak modeller büyük ölçüde eğitildikleri dilde yerleşik kalıpları izliyor. Bu sistemler politika yazımında, sistem tasarımında ya da günlük iyileştirme önerilerinde giderek daha fazla yardımcı olurken, sessizce bizi daha karmaşık, daha dağınık çözümlere yönlendirebilirler. Bu ortak “ekleme yanlılığını” tanımak, yalnızca “Ne ekleyebiliriz?” sorusunu değil, aynı zamanda “Neyi çıkarabiliriz?” sorusunu sormamızı hatırlatacak araçlar ve alışkanlıklar tasarlamak için ilk adımdır.

Atıf: Uhler, L., Jordan, V., Buder, J. et al. Influence of solution efficiency and valence of instruction on additive and subtractive solution strategies in humans, GPT-4, and GPT-4o. Commun Psychol 4, 41 (2026). https://doi.org/10.1038/s44271-026-00403-0

Anahtar kelimeler: toplama eğilimi, çıkarma temelli akıl yürütme, büyük dil modelleri, insan–Yapay Zeka karşılaştırması, karar verme