Clear Sky Science · tr
Robot yetkinliğini yargılamada tanısallığın rolü
Robot hatalarının hepimiz için neden önemi var
Robotlar ve yapay zekâ sistemleri hızla laboratuvarlardan fabrikalara, hastanelere ve sokaklarımıza giriyor. Onlara güvenmeye başladıkça kritik bir soru ortaya çıkıyor: İnsanlar bir robotun gerçekten yetkin olup olmadığına nasıl karar veriyor? Bu makale genellikle iyi performans gösteren ama ara sıra şaşırtıcı bir hata yapan—veya beklenmedik bir başarı sergileyen—bir robota nasıl hüküm verildiğini inceliyor. Bulgular, makineler hakkındaki “içgüdülerimizin” açıkça söylediklerimizden neden farklı olabileceğini ve tek bir hatanın neden bazen görmezden gelinirken bazen de güvenimizi kalıcı olarak değiştirebileceğini açıklamaya yardımcı oluyor.
Zihinlerimizin makineleri yargılama biçiminde iki yol
Psikologlar iki tür izlenim arasında ayrım yapar. Açık izlenimler, bir robotu 1–7 arası bir yetkinlik ölçeğinde puanlamak gibi, sorulduğunda doğrudan rapor edebildiğimiz yargılardır. Örtük izlenimler ise daha otomatik olup, insanların değerlendirmeye odaklanmadan verdikleri hızlı tepkilerde kendini gösterir. Önceki çalışmalar açık izlenimlerin yeni davranışları gördüğümüzde hızla değiştiğini, örtük izlenimlerin ise daha yavaş hareket ettiğini öne sürmüştü. Bu çalışma, bu farkın gerçekten farklı zihinsel sistemlerle mi ilgili olduğunu—yoksa yeni davranışın robotun gerçek yetenekleri hakkında ne kadar bilgilendirici ya da tanısal göründüğüne bağlı olup olmadığını—sorguluyor.

Fabrika katlarından ameliyathanelere ve otoyollara
3.700’den fazla katılımcıyla yapılan dokuz çevrimiçi deneyde, araştırmacılar insanlara gerçekçi ortamlarda çalışan farklı robotları gösterdiler: kalabalık bir depoda dolaşan endüstriyel bir robot, hassas yollar çizen bir cerrahi robot ve yoldaki engellere tepki veren bir sürücüsüz otomobil. Bazen robot sürekli yetenekli ya da sürekli sakar davranıyordu. Diğer durumlarda çoğunlukla yetkin olup tek bir açık hata yapıyor ya da çoğunlukla yetersiz olup tek bir dikkat çekici başarı gösteriyordu. Bu performans dizilerini izledikten sonra katılımcıların izlenimleri iki biçimde ölçüldü: doğrudan öz bildirim soruları ve hızlı, otomatik tepkileri yakalayan dolaylı görevler.
Bir tuhaf performansın öne çıkması ne zaman olur
Bu gerçekçi senaryolarda, insanların robotlara verdikleri açık puanlar hem genel performans desenini hem de nadir “tuhaf” denemeyi yansıtıyordu. Birçok başarı arasında tek bir hata açıkça açık puanları düşürebilir, birçoğu başarısızlık arasında tek bir başarıysa onları yükseltebilirdi. Örtük izlenimler ise farklı bir resim sundu. Örtük tepkiler robotun tipik davranışına—genellikle yetkin olup olmadığına—güçlü tepki verirken, tekil tuhaf denemeyi büyük ölçüde görmezden geldi. Araştırmacıların “açık” ve “örtük” görevleri katılımcılara bilerek yargılamaya yönlendirildikleri ayrımı dışında mümkün olduğunca benzer görünüp hissettirecek şekilde yeniden tasarladığı durumlarda bile bu ayrışma devam etti.
Bir robotun hatasının gerçekten belirleyici olmasını ne sağlar
Ekip sonra kilit bir fikri test etti: tuhaf bir olayın etkisinin, insanların bunun robot hakkında kalıcı bir şey ortaya koyup koymadığını düşündüğü—yani ne kadar tanısal göründüğüne—bağlı olduğuydu. Yeni çalışmalarda katılımcılar önce birkaç kusursuz deneme gerçekleştiren bir robot gördü, sonra bir veya daha fazla başarısızlık izledi. Sonuç başarısızlıklar önemli, yakın tarihte gerçekleşmiş olarak çerçevelendiğinde veya birkaç başarısızlık birikerek önceki başarı miktarına denk geldiğinde hem açık hem örtük izlenimler kaydı. Kritik olarak, bu yüksek-tanısal koşullar altında tek bir hata bile otomatik, örtük izlenimleri etkilemeye yetiyordu. Aynı tür aksaklık eskimiş, önemsiz veya tek seferlik bir rastlantı olarak tanımlandığında ise örtük izlenimler neredeyse hiç değişmedi; oysa açık puanlar hâlâ hareket etti.

Günlük hayatta Yapay Zekâya güven için bunun önemi
Bir arada ele alındığında, bulgular robot yetkinliği hakkındaki hızlı, otomatik izlenimlerimizin yeni bilgilere kör olmadığını, ancak değişmeden önce daha güçlü veya daha açıkça anlamlı kanıtlar gerektirdiğini öne sürüyor. Konuşarak verdiğimiz puanlar ise zayıf veya belirsiz olaylara karşı bile oldukça duyarlı; bunun bir kısmı birinden yargı istenildiğinde elimizdeki her türlü bilgiyi kullanma baskısı hissetmemizden kaynaklanıyor. Tasarımcılar, mühendisler ve politika yapıcılar için bu, robotlara güven yönetmenin yalnızca hataları azaltmakla ilgili olmadığı, aynı zamanda bu hataların nasıl çerçevelendiği ve anlaşıldığıyla da ilgili olduğu anlamına geliyor. Açıkça durması gereken bir araç gibi görünürken durmaması gibi tek, çok belirleyici bir hata—örneğin bir arabanın açıkça durması gerektiğinde durmaması—hem içgüdülerimizi hem de ifade ettiğimiz görüşleri yeniden şekillendirebilir ve akıllı makineleri benimseme ve onlara güvenme isteğimiz üzerinde doğrudan sonuçlar doğurabilir.
Atıf: Surdel, N., Ferguson, M.J. The role of diagnosticity in judging robot competence. Sci Rep 16, 7578 (2026). https://doi.org/10.1038/s41598-026-35375-y
Anahtar kelimeler: robot yetkinliği, insan-robot etkileşimi, örtük önyargı, Yapay Zekâya güven, tanısal bilgi