Clear Sky Science · tr

İlerleyici yığma sözde ters öğrenme ile antik mimari görüntü sınıflandırması

· Dizine geri dön

Neden eski yapılar modern algoritmalarla buluşuyor

Çin genelinde, geniş saçaklı çatılara ve karmaşık ahşap konsol düzeneklerine sahip tapınaklar ve saraylar yoğun biçimde fotoğraflanıyor. Arşivciler ve koruma uzmanları bu görüntüleri hızla sınıflandırmak zorunda; oysa gözle yapılan sınıflandırma yavaş ve öznel oluyor. Bu makale, bilgisayarlara antik yapı fotoğraflarını daha doğru ve verimli şekilde tanıtmayı sağlayan yeni bir yaklaşım sunuyor; böylece kültürel mirasın dijital çağda korunmasına katkı sağlanıyor.

Figure 1
Figure 1.

Bu yapıların birbirinden ayrılmasını zorlaştıran nedir

Antik Çin mimarisi, kıvrımlı çatı hatları, saçak altındaki katmanlı konsol setleri, oyma kirişler ve renkli yüzey süslemeleri gibi tekrarlayan zengin motiflerle doludur. Birçok yapı benzer düzenleri paylaşır; aralarındaki farklar çatı eğrisi veya konsol biçimindeki ince değişimlerle sınırlı olabilir. Geleneksel görüntü tanıma sistemleri, iç ağırlıkları kademeli olarak ayarlayarak öğrendiği için bu ince farklardan ve duvar rengi veya aydınlatma gibi dikkat dağıtıcı ipuçlarından kolayca etkilenebilir. Ayrıca büyük bir görüntü kümesi üzerinde tek seferde eğitildiklerinde bir bölgeye veya üsluba aşırı uyum sağlayıp diğer sitelerdeki yapılara genelleme yetenekleri azalabilir.

Ana ayrıntılara daha akıllıca bakmak

Yazarlar, antik mimari görüntü sınıflandırması için ilerleyici yığma sözde ters öğrenme (AAPSP) adlı bir çerçeve tanıtıyor. Bunun merkezinde anahtar özelliklerin yığılması sözde ters öğrenme (KFSP) adlı bir modül bulunuyor. Tamamen rastgele ayarlardan başlamak yerine KFSP, her biri belirli görsel özelliklere uyacak şekilde başlatılan birkaç paralel “temel öğrenici” inşa ediyor. İki dal, çatı hatları gibi düzgün, sürekli yapılara özellikle duyarlı olacak biçimde ayarlanırken üçüncü dal süs motifleri gibi daha dağınık dokuları yakalamaya odaklanıyor. Sözde ters öğrenme olarak bilinen matematiksel bir kestirme, bu dalların esasen tek seferde eğitilmesine olanak veriyor ve geleneksel derin öğrenmedeki yavaş, adım adım ağırlık güncellemelerinden kaçınıyor.

Modelin önemli yerlere dikkat etmesine izin vermek

Birden fazla dala sahip olmak tek başına yeterli değil; sistem ayrıca her karar için hangi dalın en yararlı olduğunu da belirlemeli. Bunu yapmak için KFSP, her bir dalın çıktısının gerçek yapı etiketleriyle ne kadar örtüştüğünü ölçen bir dikkat mekanizması kullanır. Kova kemeri şekli ya da sırt süslemesinin konturu gibi ayırt edici öğeleri daha iyi yakalayan dallara, çıktılar birleştirilirken otomatik olarak daha fazla etki verilir. Bu yığılmış temsil, antik mimarideki altta yatan “şekil mantığı”na daha yakın bir özellik uzayı oluşturur; böylece benzer yapısal bileşenlere sahip yapılar kümelenir, farklı üsluptakiler daha net ayrışır.

Figure 2
Figure 2.

En bilgilendirici fotoğraflardan öğrenmek

İkinci temel modül olan ilerleyici optimizasyon öğrenmesi (POL), farklı bir sorunu ele alır: yinelenen eğitim görüntüleri. Veri kümesindeki birçok fotoğraf aynı cephenin neredeyse özdeş görünümlerini gösterir ve pek yeni bilgi sunmaz. POL, veriyi başlangıçta bir eğitim setine ve daha büyük bir aday havuzuna ayırarak başlar. Aktif öğrenme fikirlerini kullanarak, mevcut modelin her aday görüntüyü ne kadar eminlikle sınıflandırdığını ve özelliklerinin ne kadar sıra dışı göründüğünü analiz eder. Hem belirsiz hem ayırt edici olan —örneğin nadir konsol düzenleri ya da alışılmadık çatı kombinasyonları gibi— fotoğraflar kademeli olarak eğitim setine alınır. Bu döngü tekrarlandıkça, kullanılan toplam görüntü sayısını artırmadan zorlayıcı ve çeşitli örneklerle eğitim verisi sürekli zenginleştirilir.

Uygulamada ne kadar iyi çalışıyor

Yazarlar yaklaşımlarını altı ünlü tapınak ve saraya ait 2.269 görüntüden oluşan halka açık bir koleksiyon üzerinde test ettiler. Sadece KFSP uygulandığında bile sistem, tamamen rastgele projeksiyonlara dayanan karşılaştırılabilir bir yöntemi geride bıraktı. POL’nin ilerleyici örnek seçimi eklendiğinde sınıflandırma doğruluğu daha da arttı ve doğruluk, geri çağırma ve F1 skoru gibi ölçütler yükseldi. Başka bir deyişle, model hem doğru tahminlerde daha güvenilir oldu hem de daha az yaygın kategorileri bulmada gelişme gösterdi. Çalışma ayrıca hâlâ çözülmesi gereken bir zorluğu vurguladı: çok az görüntüye sahip sınıflar hâlâ sorun teşkil ediyor; çünkü ne kadar akıllı olursa olsun bir öğrenici, öğrenilecek çeşitlilik çok az olduğunda zorlanıyor.

Kültürel miras için bunun önemi nedir

Modelin neye dikkat ettiğini ve hangi görüntülerden öğrendiğini dikkatlice yönlendirerek, AAPSP tarihi yapı fotoğraflarını sınıflandırmak ve incelemek için daha hassas bir araç sunuyor. Miras profesyonelleri için bu, dijital arşivlerin daha hızlı oluşturulması, mimari üslupların tarihlendirilmesi ve karşılaştırılması için daha iyi destek ve farklı bölgelerde dağılan sitelerin daha sağlam izlenmesi anlamına geliyor. Yöntem Çin antik mimarisine özgü olsa da, kilit yapısal ayrıntıları öne çıkarma ve nadir fakat bilgilendirici örneklere kademeli olarak odaklanma gibi temel fikirleri heykellerden tarihi sokak manzaralarına kadar diğer kültürel nesnelere uyarlanabilir.

Atıf: Cai, Z., Sun, X., Zhang, S. et al. Ancient architecture image classification with progressive stacking pseudoinverse learning. Sci Rep 16, 14626 (2026). https://doi.org/10.1038/s41598-026-44876-9

Anahtar kelimeler: antik mimari, görüntü sınıflandırması, kültürel miras, makine öğrenimi, aktif öğrenme