Clear Sky Science · tr

Alım- Destekli LLM’ler ve Stabil Diffusion Sahne Modellemesi ile film senaryosu oluşturmanın geliştirilmesi

· Dizine geri dön

Fikirleri Senaryolara ve Sahnelere Dönüştürmek

Bir film ya da oyun senaryosu yazmayı denemiş olanlar, gevşek bir fikri zengin diyaloglara ve canlı sahnelere dönüştürmenin ne kadar zor olduğunu bilir. Bu çalışma, yeni yapay zeka araçlarının insanların basit bir yazılı istemden tam bir senaryoya ve hatta kaba görsel sahnelere geçmesine nasıl yardımcı olabileceğini araştırıyor; böylece daha fazla yaratıcının, büyük bir stüdyoya ihtiyaç duymadan hikâyelerini hayata geçirmesi kolaylaşıyor.

Neden Senaryo Yazımı Desteklenmeli

Modern filmler, diziler, oyunlar ve reklâmlar, kimin ne söylediğini, nerede olduklarını ve nasıl davrandıklarını ayrıntılı biçimde belirten özenle hazırlanmış senaryolara dayanır. Bu düzeyde ayrıntıyı elle oluşturmak yavaş ve talepkârdır; özellikle yapımcılar belirli kültürlere, ruh hallerine veya markalara göre güçlü biçimde uyarlanmış içerik istediklerinde. Yazarlar, bu sürecin bazı bölümlerinin otomatikleştirilmesinin yeni hikâye anlatıcıları için engelleri azaltabileceğini, böylece onların anlatının özüne odaklanmasına ve bilgisayarların yineleyici yazma görevlerini üstlenip uzun sahneler boyunca ayrıntıları takip etmesine izin verebileceğini savunuyorlar.

Metinde Bellek ve Hayal Gücünü Harmanlamak

Çalışmanın merkezinde, güncel dil modellerinin iki gücünü birleştiren bir hat yer alıyor. İlk olarak, alım-destekli üretim (retrieval-augmented generation) adı verilen teknik, sistemin geniş bir gerçek film senaryosu kütüphanesinde arama yapıp kullanıcının istemine benzeyen pasajları çıkarmasını sağlıyor. Bu parçalar referans notları gibi davranarak modelin inandırıcı diyalog ve yapıdan kopmamasına yardımcı oluyor. İkinci olarak, GPT-2 ve Bloom gibi standart dil modelleri binlerce senaryo üzerinde ince ayar yapılarak doğal konuşma, tempo ve sahne akışı kalıplarını öğreniyor. Bu eşleştirme, çıktıyı hem yaratıcı hem de kullanıcının istediğine sadık tutmayı, ayrıca uydurma veya konudan sapma oranını azaltmayı hedefliyor.

Figure 1. Yapay zekanın basit bir fikri hem film senaryosuna hem de eşleşen görsel sahnelere nasıl dönüştürdüğü.
Figure 1. Yapay zekanın basit bir fikri hem film senaryosuna hem de eşleşen görsel sahnelere nasıl dönüştürdüğü.

Sayfadaki Sözlerden Ekrandaki Görüntülere

Çerçeve sadece metinle sınırlı kalmıyor. Ekip, senaryo motorunu Stable Diffusion olarak bilinen bir görüntü üreteciyle bağlıyor; bu, kısa sahne açıklamalarını hikâye panosu gibi kavramsal sanatlara dönüştürebiliyor. Sistem önce kullanıcı sorgusunu anlamını yakalayan kompakt sayısal bir forma çeviriyor, ardından rastgele görsel gürültüyü kademeli olarak sahneyle eşleşen net bir görüntüye dönüştürüyor. Bu, yazarlar ve yönetmenler için bir mekânın, karakterin veya anın nasıl görünebileceğini çabucak görme, tempo, ruh hali ve kamera açılarını yapımın erken aşamasında ayarlama imkânı sağlıyor.

Sistemin Performansı Ne Kadar İyi

Sistemin ne kadar yararlı olduğunu değerlendirmek için yazarlar, girdi istemlerini üretilen senaryolarla iki yaygın ölçü kullanarak karşılaştırıyor. Kosinüs benzerliği, çıktının anlamının isteme ne kadar yakın olduğunu kontrol ederken, perplexity metnin akıcı ve tahmin edilebilir olup olmadığını yansıtıyor. 5.000 film senaryosundan oluşan veri setlerinde, Gemini-Pro kullanan alım tabanlı model kullanıcı istemleriyle en güçlü eşleşmeyi gösteriyor; bu da yazmadan önce gerçek senaryo parçalarını aramanın hikâyeyi rotasında tutmaya yardımcı olduğunu öne sürüyor. İnce ayarlanmış GPT-2 ve Bloom, düşük perplexity ile tutarlı metin üretiyor; yani ifade ve akış doğal hissediliyor. Görüntüler için ekip, resimlerin metin istemleriyle ne derece uyumlu olduğunu kontrol eden bir puan kullanıyor; elde edilen sonuçlar ılımlı başarı gösteriyor ve daha keskin görsel detay ile yazılı sahnelere daha yakın bağlar için açık bir geliştirme alanı bırakıyor.

Figure 2. Depolanan senaryoların, yeni sahneler yazan ve ardından bunları görüntülere dönüştüren bir yapay zeka hattını nasıl yönlendirdiği.
Figure 2. Depolanan senaryoların, yeni sahneler yazan ve ardından bunları görüntülere dönüştüren bir yapay zeka hattını nasıl yönlendirdiği.

Gelecekteki Hikâye Anlatıcıları İçin Ne Anlama Geliyor

Basitçe söylemek gerekirse, çalışma arama, akıllı metin modelleri ve görüntü üreteçlerini birleştirmenin kısa bir fikri hem bir senaryoya hem de makul doğrulukta bir dizi kaba sahneye dönüştürebileceğini gösteriyor. Sistem insan yazarların yerini almıyor, ancak diyalog öneren, bağlamı takip eden ve görsel taslaklar sunan hızlı bir asistan olarak hareket edebilir. Görsel taraf geliştikçe ve modeller daha çeşitli senaryolar üzerinde eğitildikçe, bu tür araçlar film, oyun ve pazarlama alanlarındaki yaratıcıların daha serbestçe denemeler yapmasına, hikâyelerini daha hızlı rafine etmesine ve ilk taslaktan itibaren işbirlikçileriyle net hikâye vizyonları paylaşmasına yardımcı olabilir.

Atıf: Lulla, A., Koul, A., Agni Mithra, R. et al. Enhancing movie script creation through retrieval-augmented LLMs and stable diffusion scene modeling. Sci Rep 16, 15284 (2026). https://doi.org/10.1038/s41598-026-45852-z

Anahtar kelimeler: film senaryosu üretimi, alım destekli üretim, büyük dil modelleri, stable diffusion, çokmodlu hikâyeleştirme