Clear Sky Science · tr

Çin manzara resimleri için geliştirilmiş anlamsal ve eskiz ikili koşullu rehberli bir görüntü tamamlama modeli

· Dizine geri dön

Kırılgan Baş Yapıtlara Dijital Oksijen Vermek

Sisli dağları ve akıcı fırça darbeleriyle değer verilen eski Çin manzara resimleri aynı zamanda kırılgan nesnelerdir: yüzyıllar boyunca uğradıkları kullanma, böcek zararları ve nem onları çatlaklar, solucan delikleri ve eksik yamalarla dolu bırakır. Restoratörler mevcut olanı korumak ile daha fazla hasara yol açmamak arasında denge kurmak zorundadır. Bu çalışma, bu resimlerin dijital ortamda onarımını desteklemek için özel olarak tasarlanmış bir yapay zeka (YZ) yöntemi sunar; kayıpları doldururken sanatçının özgün yapısına ve üslubuna sadık kalmayı amaçlar.

Neden Eski Resimler Yeni Teknoloji Gerektirir

Geleneksel Çin manzaraları iki geniş geleneğe dayanır: güçlü, heybetli zirveleriyle Kuzey Okulu ve yumuşak mürekkep yıkamaları ile boşluğu vurgulayan Güney Okulu. Her ikisi de kağıt veya ipek bozulduğunda kolayca bozulan ince çizgi ve ton değişimlerine dayanır. Elle yapılan rötuşlar zaman alıcıdır ve geri döndürülemez; yanlış bir darbe bir başyapıtı kalıcı olarak değiştirebilir. Önceki dijital teknikler ya yakın pikselleri kopyaladı ya da genel amaçlı fotoğraf araçlarına bel bağladı. Sokak fotoğraflarındaki delikleri yamalayabilirlerdi, ancak resimlerde çoğu zaman başarısız olup garip kayalar, kırık ağaç gövdeleri veya uzmanlara ‘yanlış’ gelen fırça işçilikleri ürettiler.

Yeni YZ Yapıyı ve Anlamı Nasıl Öğreniyor

Bu sınırlamaları aşmak için yazarlar bir resmi eş zamanlı olarak üç tamamlayıcı açıdan inceleyen bir restorasyon sistemi tasarladı. Önce, ince mürekkep geçişlerini korumak üzere ayarlanmış bir kenar algılama ağı kullanarak, cesur dağ sırtlarından zayıf doku çizgilerine kadar her çizginin gücünü gösteren ayrıntılı bir “eskiz” çıkarıyor. İkinci olarak, her bölgenin neyi temsil ettiğini—gökyüzü, su, kaya, yaprak—renk kodlu bir harita halinde oluşturan denetimsiz bir anlamsal segmentasyon modeli kuruyor. Üçüncü olarak, kısmen maskelenmiş görüntünün kendisini analiz ediyor. Bu üç akış birleştiriliyor ve dil için geliştirilen güçlü bir YZ mimarisi olan Transformer’a besleniyor; Transformer eksik yamaların hem altta yatan yapıyla hem de genel sahneyle uyumlu olacak şekilde nasıl görünmesi gerektiğini tahmin ediyor.

Figure 1
Figure 1.

YZ’ye Sadece Şekilleri Değil, Fırça İşçiliğini de Taklit Etmeyi Öğretmek

Bilesimi yakalamak zorluğun yalnızca yarısıdır; doldurma aynı zamanda sanatçının elini de yakalamalıdır. Bu yüzden ekip, fırça darbesinin ve mürekkebin ince niteliklerine—darbenin nasıl inceldiğine, kayalık yüzeylerde dokunun nasıl oluştuğuna, yıkamaların boş kağıda nasıl karıştığına—odaklanan hafif bir stilistik özellik çıkarım modülü ekledi. Bu modül, resmin görünen kısımlarından stil açısından önemli bilgileri damıtarak sistemi eksik bölgeleri yeniden oluştururken birden çok aşamada enjekte ediyor; böylece çıktı, orijinalin aynı ritmine ve tonlamasına doğru yönlendiriliyor. Eğitim, yalnızca piksel düzeyindeki hataları değil, aynı zamanda algılanan yapı, doku istatistikleri ve genel üsluptaki uyumsuzlukları da cezalandıran bileşik bir hedefle yönlendiriliyor; bu, sonuçların sadece bir hesap makinesine değil insan gözüne de “doğru” görünmesini teşvik ediyor.

Figure 2
Figure 2.

Yöntemi Test Etmek

Yaklaşımı değerlendirmek için araştırmacılar, kamu müze koleksiyonlarından ve açık bir karşılaştırma veri kümesinden neredeyse 5.000 yüksek kaliteli manzara resminden oluşan büyük bir veri seti derledi ve Kuzey ile Güney Okulu eserlerini dengelediler. Gerçek hasarı taklit eden düzensiz maskeler—küçük kayıplar, geniş sıyrıklar ve kümelenmiş solucan delikleri—dijital olarak uyguladılar ve yöntemlerini geniş kullanılan konvolüsyonel ağlar, Transformer modelleri ve modern difüzyon modelleri dahil olmak üzere altı önde gelen tamamlama sistemiyle karşılaştırdılar. Çeşitli hasar seviyelerinde yeni model keskinlik, yapısal benzerlik ve görsel gerçekçilik skorlarında tutarlı biçimde daha yüksek puanlar aldı. Yakınlaştırılmış karşılaştırmalar daha düzgün dağ konturları, daha inandırıcı ağaç dalları ve dokunun dokunulmamış alanlara sorunsuzca karıştığını gösteren mürekkep dokuları ortaya koydu. Eğitilmiş ressamlar da dahil insan değerlendiriciler restorasyonlarını yapı ve üslup açısından daha tutarlı bularak tercih etti.

Bu Kültürel Miras İçin Ne Anlama Geliyor

Açıkça söylemek gerekirse, çalışma bir YZ sisteminin görüntülerde sadece “delikleri doldurmak” için değil, geleneksel Çin manzara resminin iç mantığına ve karakterine saygı gösterecek şekilde eğitilebileceğini gösteriyor. Çizgi çizimleri, bölge anlamı ve stil ipuçlarını birleştirerek model, eksik parçaları orijinal parşömenin gerçekten ait olabilecekmiş gibi görünen şekilde yeniden inşa ediyor. Bir restorasyon uzmanının yerini alamasa da müzelere ve araştırmacılara olası restorasyonları görselleştirmek, tedavileri planlamak ve kırılgan eserlerin daha eksiksiz dijital temsillerini oluşturmak için güçlü, invaziv olmayan bir araç sunuyor—bu manzaraların kağıt artık açılmayacak kadar hassaslaştıktan sonra bile korunmasına ve incelenmesine yardımcı oluyor.

Atıf: Cao, S., Mu, D., Zhang, Y. et al. An improved semantic and sketch biconditional guided image inpainting model for Chinese landscape painting. npj Herit. Sci. 14, 103 (2026). https://doi.org/10.1038/s40494-026-02371-4

Anahtar kelimeler: dijital restorasyon, Çin manzara resimleri, görüntü tamamlama, kültürel miras, sanat koruma