Clear Sky Science · tr

Anlatı bağlamı bakışı görselden anlamsal belirginliğe kaydırıyor

· Dizine geri dön

Gözlerimizin sadece en parlak şeye bakmamasının nedeni

Bir resme baktığınızda gözleriniz sahnenin farklı kısımlarına kısa sürelerde sıçrayarak konumlanır. Bakışınızın en çok renkli ya da yüksek kontrastlı olan öğelere çekildiği açık gibi görünebilir. Ancak günlük hayatta genellikle hikâyeleri takip ederiz—bir film izlerken, çizgi roman okurken, fotoğraflarda gezinirken—ve olup biteni anlamaya çalışırız. Bu çalışma basit ama güçlü bir soru soruyor: bir hikâye ilerledikçe gözlerimiz en gösterişli parçaları mı kovalar, yoksa olay örgüsünü anlamak açısından en önemli bölümlere mi kayar?

Figure 1
Figure 1.

Sözcüksüz resimli hikâyeleri izlemek

Araştırmacılar yetişkinleri, bir çocuk ve onun hayvan arkadaşları hakkında kısa, sözcüksüz resimli hikâyeler izlemeye davet etti. Her hikâye, özgün sıralarında belirgin bir başlangıç, gelişme ve sonuç oluşturan 24 el çizimi görüntüden oluşuyordu. Katılımcılar bazen resimleri doğru sırada gördü; böylece zihinlerinde tutarlı bir hikâye kurulabiliyordu. Diğer zamanlarda aynı resimler rastgele bir düzene karıştırıldı, öykü akışı bozulurken görsel içerik aynı kaldı. Katılımcılara yalnızca resimlere serbestçe bakmaları söylendi ve göz hareketleri yüksek hassasiyetli izleme cihazlarıyla kaydedildi.

Görsel olarak çarpıcı olan ile anlamlı olanı ölçmek

Her görüntünün hangi yönlerinin gözleri çektiğini anlamak için ekip iki çok farklı “önem” türünü karşılaştırdı. Önce görsel belirginlik tahmin edildi—bir nesnenin yalnızca kontrast ve kenarlar gibi görüntü özellikleri nedeniyle ne kadar öne çıktığı—tek resimlerde insanların nereye bakma eğiliminde olduğunu öngören gelişmiş bilgisayar görüsü modelleri kullanılarak. İkinci olarak anlamsal belirginlik tahmin edildi—bir nesnenin hikâyeyi anlamak açısından ne kadar önemli olduğu. Bunun için ayrı gönüllüler her resim dizisini tutarlı sıra ile tanımlayan kısa anlatılar yazdı. Ardından büyük bir dil modeli (metin üzerinde eğitilmiş modern bir yapay zeka sistemi) bu anlatılardaki her kelimenin, önceki bağlama göre ne kadar şaşırtıcı olduğunu hesaplamak için kullanıldı ve bu şaşkınlık puanları resimlerdeki belirli nesnelere eşlendi (örneğin aniden başka bir kurbağayı ısıran kıskanç kurbağa gibi).

Hikâye sırası nerelere ve ne zaman baktığımızı nasıl değiştiriyor

Bu ölçümlerle yazarlar bakışın iki yönünü inceledi: her nesnenin ne sıklıkta sabitlendiği ve ilk bakışın onu ne kadar çabuk çektiği. Koşullar arasında güçlü görsel olarak belirgin nesneler, şaşırtıcı olmayan şekilde, diğer görüntü parçalarından daha sık ve daha erken bakılıyordu. Ancak kilit bulgu tutarlı ve karıştırılmış hikâye sırasını karşılaştırırken ortaya çıktı. Resimler anlamlı bir sıra oluşturduğunda izleyiciler göreli olarak daha sık anlamsal açıdan önemli nesnelere baktı—öyküsel ağırlık taşıyanlara—aynı görüntüler karıştırıldığında olduğundan daha fazla. Ayrıca bu anlamlı nesnelere her beş saniyelik izleme süresi içinde daha erken bakma eğilimi gösterdiler. Buna karşılık, görsel açıdan çarpıcı nesnelerin avantajı tutarlı hikâyelerde artmadı; mantıklı bir anlatı kurulabildiğinde erken baskınlıkları muhtemelen daha hızlı azaldı.

Dikkatin zaman içindeki seyri

Çalışma ayrıca bu dengenin ardışık göz hareketleri boyunca nasıl değiştiğini izledi. Her yeni görüntü belirdikten sonraki ilk birkaç sabitleme görsel belirginlik tarafından güçlü şekilde yönlendirildi, bağlam ne olursa olsun: gözler başlangıçta sahnenin fiziksel olarak öne çıkan kısımlarına atlıyordu. Ancak izleme sürdükçe, özellikle birkaç sabitleme gerçekleştikten sonra, bir ayrışma ortaya çıktı. Karıştırılmış dizilerde insanlar görsel olarak belirgin bölgeleri tercih etmeye devam etti. Tutarlı dizilerde ise gözleri giderek açılan hikâyin iç modelini güncellemeye yardımcı olan anlamsal açıdan önemli nesnelere kaydı. Bu desen yalnızca en tekil en belirgin nesne için değil, sahnedeki tüm nesneler için geçerliydi: tutarlı hikâyelerde anlamsal önem, nesnelere ne sıklıkta ve ne kadar hızlı bakıldığını daha iyi öngördü.

Figure 2
Figure 2.

Bu bulgular sahneleri nasıl anladığımızı ne gösteriyor

Bu sonuçlar gözlerimizin yalnızca parlaklık ve kontrastın kölesi olmadığını öne sürüyor. Bunun yerine gözlerimiz merakımızı ve anlama çabamızı destekliyor. İlk bakışta sahnenin görsel olarak en gürültülü kısımlarını yokluyoruz, ama bir saniyenin kesirleri içinde ‘‘burada ne oluyor?’’ içsel hissimiz bakışımızı hikâye için önemli parçalara yönlendirmeye başlıyor—örneğin görsel olarak sade bir kapı veya rahatsız bir kurbağa gibi. Göz izleme, görüntü tabanlı modeller ve dil tabanlı yapay zekayı birleştirerek, çalışmanın anlatı bağlamının resimleri nasıl keşfettiğimizi yeniden şekillendirdiğini gösteriyor. Günlük hayatta bu, göz hareketlerinin yalnızca ne gördüğümüzü değil, zihinlerimizde kurduğumuz görünmez hikâyeyi de açığa çıkardığı anlamına geliyor.

Atıf: Berlot, E., Schmitt, LM., Huber-Huber, C. et al. Narrative context shifts gaze from visual to semantic salience. Commun Psychol 4, 59 (2026). https://doi.org/10.1038/s44271-026-00426-7

Anahtar kelimeler: göz hareketleri, görsel dikkat, hikâye algısı, anlamsal belirginlik, dil modelleri