Clear Sky Science · tr

ABD pazarında Amazon X-Ray ile IMDb’nin birleştirildiği sahne düzeyinde film verileri

· Dizine geri dön

Kültürü Anlamak İçin Film Sahneleri Neden Önemli?

Filmler dünyayı görme biçimimizi şekillendirir; ancak film araştırmalarının çoğu gişe rakamları, temel türler veya yıldız etkisi üzerine odaklanmıştır, sahne sahne ekranda gerçekten neler olduğuna değil. Bu makale, araştırmacıların ABD’de Amazon Prime Video’da yayınlanan üç binden fazla filmin tek tek sahnelerine, karakterlerine ve repliklerine kadar yakınsamasına imkân veren yeni bir veri kümesini tanıtıyor. Amazon’un X-Ray özelliğini Internet Movie Database (IMDb) ile birleştirerek yazarlar, her filmde kimin nerede ve ne zaman göründüğünü ayrıntılı ve standart bir harita halinde sunuyor; bu da temsil, hikâye anlatımı ve videodan öğrenen yapay zeka sistemleri gibi daha zengin çalışmaların önünü açıyor.

Figure 1
Figure 1.

Ham Senaryolardan Bitmiş Sahnelere

Bugüne dek büyük ölçekli film çalışmalarının çoğu senaryolara veya altyazı dosyalarına dayanıyordu. Bu kaynaklar faydalı ama kusurludur. Senaryolar genellikle son kurgudan farklı olan erken taslaklardır ve küçük karakterleri veya geç yapılan düzenlemeleri dışarıda bırakabilir. Altyazılar konuşulan cümleleri yakalarken sessiz karakterleri, arka plan figürlerini ve tamamen görsel anlatımı —örneğin kameranın bir karakterin yüzünde uzun süre kalması— kaçırır. Bu boşluklar nedeniyle, kimin kimle etkileştiğini veya farklı grupların nasıl temsil edildiğini izlemeye yönelik önceki çabalar yalnızca metinden tahmin yapmak zorunda kaldı; bu da karakterlerin ve ilişkilerinin tanımlanmasında hatalara yol açabiliyor.

X-Ray’i Araştırmaya Uygun Veriye Dönüştürmek

Amazon’un X-Ray özelliği bu sorunların etrafından dolaşmanın bir yolunu sunuyor. İzleyiciler bir filmi duraklattığında X-Ray, şu anda ekranda olan oyuncuları ve karakterleri gösterir; bu bilgiler son düzenlenmiş filme doğrudan bağlı ve korunmuştur. Yazarlar, Ağustos 2023 itibarıyla ABD Prime Video kataloğunda bulunan 3.265 film için bu sahne düzeyindeki veriyi toplamak üzere bir iş akışı oluşturdu. Önce Prime’a dahil tüm film girdileri toplandı, X-Ray bilgisi olmayanlar elendi ve tekrarlanan başlıklar veya alternatif versiyonlardan kaynaklanan yinelenenler kaldırıldı. Kalan her film için oynatıcı tarafından X-Ray ve altyazı bilgilerini yüklemek için kullanılan veri akışları yakalandı ve sahne sınırlarını, her sahnede bulunan karakterleri ve çoğu başlık için her altyazı segmentinin kesin zamanlamasını listeleyen yapılandırılmış dosyalara kaydedildi.

Sahneleri Geniş Film Dünyasına Bağlamak

Veri kümesinin gerçek gücü bu sahne dökümlerini dış bilgiye bağlamaktan geliyor. X-Ray zaten her karakteri bir IMDb profiline bağlasa da, film için bir IMDb kimliği içermez. Yazarlar, bir filmin başlığından başlayıp IMDb’den birkaç aday eşleme alan ve ardından IMDb’deki öne çıkan oyuncu kadrosunu X-Ray verilerinde listelenen oyuncularla karşılaştıran bir eşleştirme algoritması tasarladı. En az bir önemli oyuncu örtüşüyorsa film eşleşme olarak kabul edildi. Bu otomatik süreç filmlerin büyük çoğunluğunu doğru eşleştirdi; ekip daha sonra kalan birkaç yüz sınır durumunu elle kontrol ederek yanlış sınıflandırmaları düzeltti ve stand-up özel gösterimleri gibi gerçekte anlatı filmi olmayan girdileri çıkardı. Sonuç, her sahnenin, karakterin ve altyazının yıl, ülke ve oyuncu demografileri gibi zengin meta verilere bağlanabildiği dikkatle temizlenmiş bir film seti oldu.

Figure 2
Figure 2.

Araştırmacıların Bu Filmlerle Yapabilecekleri

Her sahnenin net başlangıç ve bitiş zamanlarına ve kimlerin göründüğünü gösteren bir listeye sahip olması sayesinde araştırmacılar artık karakter etkileşimleri ve ekran sürelerinin hassas haritalarını oluşturabilir. Sahnelere hizalanmış altyazılar, karakterler ve bağlamlar arasındaki dil farklılıklarını ya da belirli temaların diyalog yoluyla nasıl geliştiğini incelemeyi mümkün kılar. Bu veri kümesini IMDb ve diğer kaynaklardan ek bilgilerle birleştirerek araştırmacılar şu tür soruları inceleyebilir: Ekrandaki cinsiyet dengesi on yıllar içinde nasıl değişti? Farklı geçmişlerden gelen karakterler eşit anlatı dikkati alıyor mu? Etkileşim kalıpları türler veya ülkeler arasında nasıl farklılaşıyor? Veri kümesi ayrıca, kimin ne zaman görünür olduğu konusunda gerçekle eşleşen veriler sağladığı için video içeriğini anlamayı amaçlayan yapay zeka modelleri için yüksek kaliteli bir kıyas (benchmark) sunar.

Gündelik Filmlere Yeni Bir Bakış

Basitçe söylemek gerekirse, bu çalışma binlerce filmi kimlerin göründüğünü, kimlerin konuştuğunu ve hikâyelerin nasıl yapılandığını sahne sahne aranabilir bir kataloğa dönüştürüyor. Koleksiyon ABD Prime Video’da bulunan başlıklarla sınırlı ve Amazon’un dahili X-Ray süreçlerine bağlı olsa da, yalnızca ünlü ödül kazananlarla sınırlı kalmayıp birçok on yıl ve türden filmleri kapsıyor. Bu kapsayıcılık, araştırmacıların hafızada kalan klasiklerin ötesinde gündelik filmleri incelemesine olanak tanıyor. Veri kümesi güncellendikçe ve genişledikçe, filmlerin toplumu nasıl yansıttığına dair anlayışımızı derinleştirme ve hem sosyal bilimcilere hem de teknolojistlere ekranda gerçekte neler olduğunu daha doğru göstermeyi vaat ediyor.

Atıf: Shrestha, S., Heo, Y., Barron, A.T.J. et al. Scene-level movie data from Amazon X-Ray in the US market combined with IMDb. Sci Data 13, 275 (2026). https://doi.org/10.1038/s41597-026-06602-y

Anahtar kelimeler: film veri kümeleri, sahne düzeyi analiz, Amazon X-Ray, IMDb meta verileri, ekranda temsil