Clear Sky Science · tr
Geliştirilmiş YOLOv11’e Dayalı batik görseli desen tespiti üzerine araştırma
Antik Kumaşın Modern Kodla Buluşması
Çin’in Miao topluluklarından gelen batik kumaş, yalnızca bir süsleme değildir: kelebekleri, ejderhaları, kuşları ve çiçekleri yazılı bir alfabenin yokluğunda tarih, inançlar ve günlük yaşamı sessizce kaydeder. Ancak bu tekstiller yaşlandıkça ve genç kuşaklar geleneksel zanaatlardan uzaklaştıkça, hayati kültürel bilgiler etiketlenmemiş fotoğraf yığınlarında ve solan kumaşlarda kaybolma riski taşır. Bu çalışma, gelişmiş görüntü tanıma yazılımının karmaşık batik görüntülerindeki küçük, örtüşen motifleri otomatik olarak bulup tanımlayabildiğini göstererek, bu yaşayan sanat formunu ölçeklenebilir şekilde korumanın ve incelemenin yeni bir yolunu sunuyor.

Bu Desenlerin Neden Önemi Var
Çin batiki, özellikle Guizhou Eyaleti’ndeki Miao halkı arasında iki bini aşkın yıldır gelişen elle boyama bir tekniktir. Bu topluluk tarihsel olarak yazılı bir dile sahip olmadığından, batik motifleri mitlerin, ritüellerin, estetiğin ve sosyal geleneklerin görsel arşivi haline gelmiştir. Araştırmacılar bu desenleri matematik, tasarım ve yapay zekâ araçlarını kullanarak dijitalleştirmeye ve analiz etmeye başladılar. Önceki çalışmalar izole motifleri oldukça iyi sınıflandırabiliyordu, ancak bu genellikle motifleri orijinal kumaştan kesmeyi gerektiriyordu; bu da her sembol ile daha geniş kompozisyon arasındaki bağı koparıyordu. Bu durum, motiflerin bir giysi veya tekstilde nasıl etkileştiğini ve katmanlı anlamlar ilettiğini anlamayı zorlaştırıyordu.
Basit Etiketlerden Akıllı Tespite
Yazarlar, ihtiyaç duyulanın yalnızca sınıflandırma değil tam nesne tespiti olduğunu; yani bir fotoğrafın tamamında her motifin yerinin bulunması ve türünün adlandırılması gerektiğini savunuyorlar. Gerçek batik görüntülerinde bu zorlu bir problemdir: tasarımlar sıkça birbirine yakındır, boyutları büyük ölçüde değişir ve sıklıkla solmuş, çatlamış veya kısmen gizlenmiş olur. Popüler YOLO (“You Only Look Once”) algoritma ailesinin önceki sürümleri de dahil olmak üzere standart tespit sistemleri bu koşullarda zorlanıyordu. Çok küçük sembolleri kaçırma, karmaşık arka planlardan dolayı kafa karışıklığı yaşama veya aydınlatma ve görüntü kalitesi dengesiz olduğunda başarısız olma eğilimindeydiler — küratörlerin ve saha araştırmacılarının en sık topladığı görüntü türleri tam da bunlar.
Ağlara Kumaşı Okutmak
Bu zorlukları ele almak için ekip önce şimdiye kadarki en büyük Çin batik tespit veri setini oluşturdu: yedi motif kategorisinde (kelebek, balık, ejderha, kuş, davul, çiçek ve meyve) 9933 sınırlayıcı kutu ile açıklanmış 861 yüksek çözünürlüklü görüntü. Görüntü boyutu ve kalitesini dikkatle dengelediler ve modelin yalnızca eğitim örneklerini ezberlememesi için kontrollü bulanıklaştırma, renk değişiklikleri, çeviriler, mozaikler ve diğer dönüşümler uygulayarak sınırlı veriyi genişlettiler. Bu veri setinin üzerine, hızlılığı ve kompakt boyutu nedeniyle — aracın müzelerde ve kültür merkezlerinde sıradan bilgisayarlarda çalıştırılması gerektiğinde önemli olan — seçilmiş keskin kenarlı bir nesne tespit çerçevesi olan geliştirilmiş bir YOLOv11 sürümü kurdular.
Daha Uzağı Görmek ve Daha Net Görmek
Geliştirilmiş model iki ana fikir ekliyor. Birincisi, VOLO “vision outlooker” mekanizmasından ilham alan bir bileşen, ağın yalnızca küçük yerel bölgelerle sınırlı kalmayıp görüntünün uzak kısımlarına aynı anda bakmasını sağlıyor. Bu, birbirinden uzak iki küçük şeklin aynı anlamlı desene ait olabileceğini ve bir motifin rolünün komşularına bağlı olduğunu anlamaya yardımcı oluyor. İkincisi, ekip ağın görüntü özelliklerini işleme biçimini Fused-MBConv adlı bir yapı kullanarak yeniden düzenledi. Bu yeniden tasarım, hesaplamaları verimli tutarken modelin gürültülü, yaşlanmış kumaşlardan ince ayrıntıları ayırt etme yeteneğini keskinleştiriyor. Testlerde ve dikkatlice yapılmış ablation çalışmalarında, nihai tasarımları temel YOLOv11 ve birkaç diğer hafif dedektöre kıyasla daha yüksek ortalama tespit doğruluğu elde ederken, gerçek zamanlı veya yakın gerçek zamanlı kullanım için hâlâ yeterince hızlı çalıştı.

Otomatik Etiketlerden Kültürel Hikâyelere
Ham tespit skorlarının ötesinde, araştırmacılar modellerini her motif türünü kökenleri, sembolik anlamları ve ilgili örneklerle ilişkilendiren bir batik bilgi grafiğine bağladılar. Bir prototip yazılım sisteminde, kullanıcı bir kumaşın fotoğrafını yükleyebiliyor, tespit edilen motifleri vurgulanmış olarak görebiliyor ve ardından bunların kültürel arka planını keşfetmek için tıklayabiliyor. Arşivciler için bu, büyük koleksiyonların daha hızlı ve daha tutarlı kataloglanması anlamına geliyor. Eğitmenler ve ziyaretçiler içinse desen tanımayı Miao inançları, ritüelleri ve estetiği hakkında öğrenmeye giriş kapısına çeviriyor. Mevcut sistem yalnızca Çin batiki üzerinde eğitilmiş olsa da yazarlar bunu, bir gün Endonezya’dan Hindistan’a kadar tekstil geleneklerini korumaya yardımcı olabilecek kültürlerarası araçlar için bir taslak olarak görüyor; böylece kumaşlar yaşlanıp solsa bile üzerlerindeki desenler konuşmaya devam edebilir.
Atıf: Li, Y., Quan, H., Li, Q. et al. Research on batik image pattern detection based on improved YOLOv11. npj Herit. Sci. 14, 143 (2026). https://doi.org/10.1038/s40494-026-02404-y
Anahtar kelimeler: batik desen tespiti, somut olmayan kültürel miras, bilgisayarlı görü, YOLO nesne tespiti, Miao tekstil sanatı