Clear Sky Science · tr

Minimum Semantic Content (MSC) Veritabanı: Hesaplamalı Estetik Araştırmaları için Büyük, Dengeli Bir Kaynak

· Dizine geri dön

Resimlerdeki güzelliği ölçmek göründüğünden daha zor

Neden bazı fotoğraflar bize güzel gelirken diğerleri donuk ya da çirkin hissi uyandırır? Renkleri, kontrastı veya bir resimdeki desenleri ölçerek bilim insanlarının buna yanıt verebileceğini düşünebilirsiniz. Ancak bir sorun var: tepkilerimiz, resmin ne gösterdiğiyle—insanlar, yerler, semboller ve anılar—iç içe geçmiş durumda. Bu makale, bu dikkat dağıtıcı unsurları olabildiğince kaldırmaya çalışarak araştırmacıların bir görüntünün saf görünüşüne göz ve beynin nasıl tepki verdiğine odaklanmasını sağlamayı hedefleyen, dikkatle tasarlanmış yeni bir görüntü koleksiyonunu tanıtıyor.

Hikâyeyi resmin dışına almak

Araştırmalarda kullanılan en popüler görüntü veritabanlarının çoğu çevrimiçi fotoğraf paylaşım siteleri ve yarışmalardan derlenir. Bu kaynaklar başlıklar, temalar ve insanların puanlamalarını sessizce yönlendiren kültürel göndermelerle birlikte gelir. Bir yarışma temasına uyan zekice bir şaka, ortalama görünen bir fotoğrafı ödüle taşıyabilir. Bayrak gibi güçlü semboller, görsel nedenlerden ziyade kültürel nedenlerle yüksek puan alabilir. Üstelik insanlar nadiren gerçekten kötü fotoğraflar yükler, bu yüzden mevcut veritabanları genellikle iyi veya daha iyi fotoğraflarla doludur. Bunların hepsi bir araya gelince, yüksek bir puanın görüntünün nasıl inşa edildiğinden—renkleri, dokuları ve şekilleri—mi yoksa ne anlama geldiğinden mi kaynaklandığını ayırt etmeyi çok zorlaştırır.

Figure 1
Figure 1.

Sessiz sahnelerden bir dünya inşa etmek

Bunu ele almak için yazarlar Minimum Semantik İçerik (MSC) veritabanını oluşturdular: görsel olarak zengin ama mümkün olduğunca az “hikâye” içeren on binden fazla görüntü. Kamuya açık fotoğraflar ve kişisel koleksiyonlarla başladılar, sonra insanları, hayvanları, binaları, yazıyı veya güçlü sembolik nesneleri içeren resimleri çıkardılar. Güçlü anılar veya duygular uyandırma olasılığı yüksek kartpostal tarzı manzara görünümlerinden de kaçındılar. Geride kalanlar çoğunlukla doğanın parçaları—yapraklar, kabuk, kayalar, bulutlar, su yüzeyleri ve orman zeminleri. Bu sahneler tamamen anlamsız değil, ama konu açısından çok daha homojen. Bu da insanların yargılarındaki farkların, kimin ya da neyin tasvir edildiğinden ziyade renk, ışık ve yapı gibi görsel niteliklerden kaynaklanma olasılığını artırır.

Güzellik ve çirkinliği isteğe bağlı üreten bir araç icat etmek

Bu dikkatli filtrelemeye rağmen başlangıç koleksiyonu yine de hoş görünen görüntülere eğilimliydi. Güzelliği bilimsel olarak iyi inceleyebilmek için, araştırmacıların çok çirkin olandan çok güzel olana kadar eşit dağılım gösteren birçok örneğe ihtiyacı vardı. Bu nedenle ekip, “Çirkinleştirici” lakaplı basit bir düzenleme programı geliştirdi. Kırk gönüllü, seçilmiş görüntüleri iki yönde zorlayarak: parlaklık, kontrast, renk karışımı, keskinlik, gürültü, kırpma ve birkaç gelişmiş dönüşümü ayarlayan kaydırıcılarla onları olabildiğince güzel veya olabildiğince çirkin hale getirdi. Araştırmacılar ayrıca bu düzenleme reçetelerinin bazılarının kaydını aldı ve bunları otomatik olarak diğer görüntülere uygulayarak büyük bir ek “çirkin” varyant topluluğu eklediler. Bu, orijinallerin, güzelleştirilmiş, çirkinleştirilmiş ve otomatik olarak çirkinleştirilmiş sahnelerin geniş bir karışımını üretti.

Binlerce kişiye gözleriyle oy verme fırsatı sunmak

Sonra yazarlar, çevrimiçi bir oyuna entegre edilmiş bir kitle kaynak platformuna başvurarak dünya çapında on binden fazla oyuncu işe aldılar. MSC setindeki her görüntü, onu çok çirkin ile çok güzel arasındaki basit beş noktalı bir ölçekte puanlayan yüz farklı uzman olmayan izleyiciye gösterildi. Ölçeğin uçlarını örnekleyen eğitim görüntüleri insanların tam aralığı kullanmasına yardımcı oldu. Rastgele tıkladığı görünen oyuncular dikkatli kalite kontrolleriyle elendi. Nihai sonuç, her sahnenin zengin bir puanlama geçmişiyle desteklendiği ve çirkin, ortalama ve güzel görüntülerin ortaya yığılmak yerine iyi temsil edildiği bir görüntü koleksiyonudur.

Bu, güzellik ve görsel yapı hakkında ne ortaya koyuyor

Bu dengeli veri kümesiyle ekip, kontrast, renk değişkenliği, kenar yoğunluğu, simetri ve fraktal benzeri doku gibi onlarca temel görüntü özelliğinin güzellik puanlarıyla nasıl ilişkilendiğini inceledi. Puanlar çirkin–güzel aralığı boyunca eşit olarak dağıldığında, bu düşük düzey özelliklerle insanların yargıları arasındaki bağlantıların daha net ve sıklıkla daha güçlü hale geldiğini buldular. Bazı durumlarda ilişkinin yönü, eski ve yanlı veritabanlarında görülenle tersine bile döndü. Ayrıca Çirkinleştiricinin dar, yapay bir çirkinlik türü üretip üretmediğini kontrol ettiler; bunun yerine düzenlenmiş görüntüler doğal olarak düşük puan alan orijinallerle benzer temel istatistikleri paylaştı; bu da manipülasyonların çizgi film gibi aşırılıklar yerine gerçek görsel eğilimleri yakaladığını gösteriyor.

Figure 2
Figure 2.

Beğeni anlayışı açısından bunun önemi

Bir sıradan izleyici için çıkarılacak sonuç, bilim insanlarının artık görsel zevki daha temiz bir şekilde inceleyebilmesidir. MSC veritabanı, güzellik ve çirkinliğin büyük ölçüde neyi tasvir ettiklerinden ziyade nasıl göründüğüne bağlı olduğu sessiz, çoğunlukla doğal sahneler dünyası sunar. Bu, görüntü yapısına dayanarak estetik tercihi tahmin etmeyi amaçlayan psikoloji, sinirbilim ve yapay zeka araştırmaları için güçlü bir test alanı yapar. Daha sonra daha karmaşık anlam ve kültürel bağlam tekrar eklenebilir. Çok az söyleyen ve görünüşleri birbirinden çok farklı olan görüntülerle başlanarak, MSC projesi güzellik duygumuzun ne kadarının zihin hikâyelerini eklemeden önce gözdendir sorusunu netleştirmeye yardımcı olur.

Atıf: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0

Anahtar kelimeler: görsel estetik, görüntü veritabanı, kitle kaynaklı puanlamalar, hesaplamalı güzellik, doğal dokular