Clear Sky Science · tr

Porselen kırıntıları tanımada zıtlaştırmalı öğrenme ile yanıltıcı özellikleri azaltmak

· Dizine geri dön

Neden kırık çömlekler modern bilim için önemli

İlk bakışta, Güney Çin’de 7.000 yıllık bir köyden çıkan kırık çömlek yığınları günümüz yapay zekâsından çok uzak görünür. Oysa bu parçalar, Neolitik insanların nasıl yaşadığını anlamada anahtar rol oynar—ve aynı zamanda günümüz görüntü tanıma sistemlerindeki gizli bir zayıflığı ortaya koyar. Bu çalışma, gelişmiş makine öğrenimi kullanarak antik Hemudu çömlek kırıntılarını türlerine ayırırken, birçok yapay zekâ sistemini etkileyen bir sorunu ele alıyor: gerçekten anlamlı ipuçları yerine yanıltıcı görsel “kısayolları” yakalama eğilimi.

Figure 1
Figure 1.

Antik çömlekler ve saklı hikâyeleri

Hemudu arkeolojik alanı yaklaşık 400.000 seramik parçası sundu; bu, Neolitik Güney Çin’de günlük yaşamı, teknolojiyi ve ticareti yeniden inşa etmek için muazzam bir hazine. Sitede iki ana çömlek türü hakim: kum dolgulu (sand-tempered) seramikler, kum ve çakıl dolgu içerir; bunlar yoğun, sert ve ısıya dayanıklıdır. Odun kömürü dolgulu (charcoal-tempered) seramiklerse yanmış bitki malzemesi karıştırılarak küçük gözenekler ve kül izleri bırakır; bu da kapları daha hafif ve daha pürüzsüz yapar. Arkeologlar bu türleri genellikle her kırık parçanın düzensiz sınırından ziyade yüzey dokusu ve malzeme bileşimine göre sınıflandırır. Bu sınıflandırmayı otomatikleştirmek, uzman zamanından büyük tasarruf sağlayabilir, ancak bunun için bilgisayarın uzmanların güvendiği aynı ipuçlarına odaklanması gerekir.

Yapay zekâ yanlış dersi aldığında

Araştırmacılar, kazı alanında dikkatle kontrol edilmiş bir görüntü koleksiyonu oluşturdular; 1.864 kırıntıyı sabit ışıklandırmalı, beyaz arka planlı karanlık bir çadır içinde fotoğrafladılar. İlginç şekilde, ilk deneyler standart bir derin ağın sadece parçaların şekillerini kullanarak çömlekleri oldukça iyi sınıflandırabildiğini gösterdi; ikili hale getirilmiş, yalnızca kontur içeren görüntülerde yüksek doğruluk elde edildi. Buna karşılık, araştırmacılar kenarları kırptığında ve sadece iç yüzey dokusunu tuttuklarında doğruluk düştü. Bu, modelin kolay fakat güvenilmez bir kısayol keşfettiği anlamına geliyordu: arkeologların kırılmanın rastgele bir sonucu olarak gördüğü belirli kırık şekilleri, çömlek türünün güvenilir bir göstergesi değil. Makine öğrenimi terimleriyle, parça şekli veri kümesindeki etiketle korelasyon gösteren ama altta yatan kategoriyle gerçekten bağlı olmayan “yanıltıcı bir özellik” olarak davranıyordu.

Modeli kısayolu görmezden gelmeye öğretmek

Sistemi daha anlamlı ipuçlarına yönlendirmek için ekip, hangi görüntülerin “benzer” veya “farklı” kabul edilmesi gerektiğini öğreten bir teknik olan zıtlaştırmalı öğrenmeye dayanan bir eğitim stratejisi tasarladı. Her çömlek fotoğrafı için, konturun çoğu kaybolacak şekilde rastgele kırpılan ve iç yüzeyi koruyan bir versiyon oluşturuldu. Her iki görüntü de aynı özellik çıkarıcı ağdan geçirildi ve eğitim süreci iç temsilciklerini birbirine yaklaştırmaya zorladı. Aynı zamanda farklı çömlek türlerinden görüntüler bu özellik uzayında birbirinden uzaklaştırıldı. Özelleştirilmiş bir “Triplet-center” kayıp fonksiyonu, aynı sınıftan kırıntı kümelerini sıkılaştırdı ve kum dolgulu ile odun kömürü dolgulu parçaların kümelerini ayırdı; bu, çıplak gözle dokuları oldukça benzer görünse bile gerçekleşti.

Figure 2
Figure 2.

Öğrenmeyi daha kararlı ve güvenilir kılmak

Bu özellik uzayını şekillendirdikten sonra araştırmacılar onu dondurup üzerine basit bir sınıflandırıcı eğittiler. Eğitim verilerine aşırı uyum sağlama tuzağından—eğitim verisinde çok iyi performans gösterip yeni örneklerde başarısız olma—kaçınmak için flooding adı verilen bir teknik kullandılar. Eğitimin hata değerini sıfıra indirmek yerine flooding kasıtlı olarak kaybı küçük, sıfır olmayan bir seviyede tutar; bu, modelin genelleme konusunda daha iyi olma eğiliminde olan geniş, düz bir çözüm bölgesine yerleşmesini teşvik eder. Ayrıca renk değişimleri ve bulanıklaştırma gibi birçok yaygın veri artırma hilesini test ettiler. Doku bilgisini bozan değişiklikler genellikle performansı düşürürken, yatay çevirme ve dikkatle ayarlanmış rastgele kırpmalar gibi şekli bozan değişiklikler modelin yanıltıcı kontur ipuçlarını görmezden gelmesine yardımcı oldu.

Arkeoloji ve yapay zekâ için anlamı

Zıtlaştırmalı eğitim, Triplet-center kaybı ve flooding kombinasyonuyla sistem Hemudu çömlek veri kümesinde %97,3 doğruluğa ulaştı ve birkaç tanınmış görüntü tanıma modelini geride bıraktı. Yöntem ayrıca nesne türlerinin yeni, alışılmadık arka planlarda ortaya çıktığı ayrı bir ölçüt üzerinde de performansı iyileştirdi; bu da birçok görsel sistemin yanıltıcı korelasyonlara karşı direnmesine yardımcı olabileceğini gösteriyor. Arkeologlar için bu tür araçlar, geniş kırıntı koleksiyonlarının daha hızlı ve tutarlı bir şekilde sınıflandırılmasını sağlayarak uzmanları tekrarlayıcı etiketlemeden ziyade yorumlamaya odaklanmaya yönlendirebilir. Genel okuyucu için çıkarım açık: yapay zekâyı kırık bir çömleğin tırtıklı konturu gibi kolay ama güvenilmez kısayolların ötesine bakmaya zorlayarak, insan uzmanların anladığına daha yakın biçimde dünyayı gören sistemler inşa edebiliriz.

Atıf: Yu, X., Li, T., Song, Z. et al. Mitigating spurious features by contrastive learning in pottery sherd recognition. npj Herit. Sci. 14, 135 (2026). https://doi.org/10.1038/s40494-025-02170-3

Anahtar kelimeler: Hemudu seramiği, zıtlaştırmalı öğrenme, yanıltıcı korelasyonlar, arkeolojik görüntüleme, görüntü sınıflandırma