Clear Sky Science · tr
İnsana özgü görsel bir beslenme benimsemek sağlam ve şekil odaklı bir yapay görme sağlar
Bilgisayarlara çocuklar gibi görmeyi öğretmenin önemi
Modern bilgisayarlı görü fotoğraflarınızı etiketleyebilir ve otonom araçları yönlendirebilir, ancak hâlâ dünyayı bizden çok farklı görüyor. İnsanlar nesnelerin genel şeklini doğal olarak kavrayıp bulanıklık, gürültü ve karmaşıklıkla başa çıkarken, birçok yapay zekâ sistemi ince dokulara takılıp görüntüler bozulduğunda çöker. Bu yazı yeni bir fikri inceliyor: görme modellerini sadece daha büyük yapmak yerine, onları insan çocukları gibi yetiştirseydik, zaman içinde gördüklerini kademeli olarak iyileştirerek ne olurdu?

Bilgisayarlar ve insanların şu an nasıl farklı gördüğü
En yaygın görme sistemlerinin çoğu baştan itibaren net, yüksek kontrastlı ve tam renkli görüntülerle eğitilir. Sonuç olarak bunlar kürk desenleri veya tuğla dokuları gibi yüzey detaylarına çok fazla güvenme eğilimindedir. Bir nesnenin konturu ile yüzey deseni kasıtlı olarak çelişkiye sokulduğunda, insanlar neredeyse her zaman kontura göre seçim yaparken, standart ağlar genellikle dokuya uyar. Bu modeller ayrıca hareketli sahnelerde gizlenmiş basit şekilleri fark etmekte zorlanır ve performansları bulanıklık, gürültü veya bizim göremediğimiz küçük dijital değişiklikler altında çökebilir. Tüm bu sorunlar yapay ve insan görüşü arasında temel bir uyumsuzluğa işaret eder.
İnsanların görsel çocukluğunu ödünç almak
İnsan bebekleri kristal netliğinde görme ile dünyaya gelmez. Dünyaları başlangıçta bulanık, düşük kontrastlı ve renk açısından kısıtlıdır; yıllar içinde yavaşça keskinleşir ve canlılaşır. Araştırmacılar, görmenin doğumdan yaklaşık 25 yaşına kadar olgunlaşmasında üç yönün —keskinlik, kontrast duyarlılığı ve renk duyarlılığı— nasıl geliştiğine dair onlarca yıllık çalışmayı bir araya getirdi. Bu ölçümleri, gelişimsel bir görsel beslenme olarak adlandırdıkları bir görüntü işleme “müfredatına” dönüştürdüler. Eğitim sırasında ağa verilen görüntüler önce güçlü biçimde bulanık, düşük kontrastlı ve griye yakınken, adım adım daha net, daha zengin kontrastlı ve tam renkli hale gelerek insan görsel gelişimini yansıtıyor.
Dokuyu izlemekten şekle odaklı görmeye
Bu gelişimsel görsel beslenme ile eğitilmiş derin ağlar, olağan yüksek kaliteli eğitimle karşılaştırıldı. Çeşitli model tasarımları ve görüntü koleksiyonları genelinde yeni yaklaşım şekle yönelik çok daha güçlü bir eğilim üretti; insan gözlemcilerde görülen aralığa ulaştı ve standart tanıma doğruluğunda çok az kayıp yaşandı. Araştırmacılar modellerin bir görüntüde hangi bölümlere dayandığını incelediklerinde, gelişimsel olarak eğitilen sistemlerin bütün nesne bölgelerine odaklandığı, standart modellerin ise küçük doku yamalarına veya arka plan alanlarına saplandığı görüldü. Daha ileri testler, bulanıklık veya sadece renkten ziyade kontrastın kademeli iyileşmesinin, ağları dağınık yerel detaylar yerine geniş nesne yapısını kullanmaya yöneltmede anahtar bir rol oynadığını gösterdi.

Gizli şekilleri tanımak ve karışık görüntülerle başa çıkmak
Araştırma ekibi daha sonra bisiklet veya yunus gibi tanıdık şekillerin karmaşık sahnelere ince biçimde dokunduğu görüntülerle modelleri zorladı. İnsanlar bu konturları kolayca fark eder, ancak mevcut sistemlerin çoğu, büyük görsel dil–görme modelleri de dâhil, çoğunlukla sahnenin arka planına tepki verir. Gelişimsel görsel beslenme ile yetiştirilen ağlar gizli şekilleri hatırlamada çok daha başarılı ve sahneden daha az dikkati dağılmaya eğilimliydi. Ayrıca görüntüler bulanıklık, gürültü, kötü aydınlatma veya yağmur ve kar gibi hava etkileriyle bozulduğunda çok daha zarif şekilde dayanabildiler; çoğu durumda insan eğilimleriyle eşleştiler. Küçük dijital değişikliklerin birçok modeli kandırdığı düşmanca (adversarial) saldırılara karşı bile, gelişimsel olarak eğitilen sistemler standart veya adversarial olarak eğitilen muadillerine göre önemli ölçüde daha doğru kaldı.
Daha güvenli ve insan benzeri yapay zekâ için ne anlama geliyor
Yapay zekâyı bizimkini yansıtan bir görsel çocuklukla besleyerek, bu çalışma bir modelin nasıl eğitildiğinin boyutunun büyüklüğü kadar önemli olabileceğini gösteriyor. Basit, biyolojik ilhamlı bir müfredat, ağları kırılgan doku numaralarından uzaklaştırıp şeklin sağlam kullanımına, karmaşıklık içindeki soyut formların daha iyi tanınmasına ve hem doğal bozulmalara hem de kasıtlı saldırılara karşı daha iyi direnç göstermeye itti. Uzman olmayanlar için temel mesaj şudur: “zayıf” görme ile başlamak ve bunun olgunlaşmasına izin vermek, makinelerin daha dayanıklı, daha insan benzeri görme yollarını öğrenmesine gerçekten yardımcı olabilir; bu da daha kaynak verimli bir yoldan daha güvenli görsel yapay zekâya ulaşmayı sağlayabilir.
Atıf: Lu, Z., Thorat, S., Cichy, R.M. et al. Adopting a human developmental visual diet yields robust and shape-based AI vision. Nat Mach Intell 8, 735–748 (2026). https://doi.org/10.1038/s42256-026-01228-6
Anahtar kelimeler: Yapay zekâ görmesi, görsel gelişim, şekil yanlılığı, sağlam algı, derin öğrenme