Clear Sky Science · tr

Prism-OBI: görsel algılama ve özellik ayrıştırma yoluyla oracle kemik yazısı tanıma için yeni bir çerçeve

· Dizine geri dön

Çatlak Kemiklerdeki Antik İzler

Üç binden fazla yıl önce, antik Çin’de insanlar tanrılara sorular kazımak için hayvan kemiklerine ve kaplumbağa kabuklarına yazılar kazıdı; böylece bilinen en eski Çin yazısı ortaya çıktı. Bugün bu oracle kemik yazıtları erken tarih için değerli ipuçları sunuyor—ancak çoğu yalnızca aşınmış, çatlak parçalar halinde günümüze ulaşmış ve uzmanlar için bile okumayı son derece zorlaştırıyor. Bu makale, hasarın ötesini görmeyi, anlamlı vuruşları jeolojik karışıklıktan ayırmayı ve araştırmacıların bu hassas kayıtları geniş ölçekte çözmesine yardımcı olmayı amaçlayan yeni bir yapay zeka sistemi olan Prism-OBI’yi tanıtıyor.

Eski Kemikleri Okumayı Zorlaştıran Nedenler

Oracle kemikler binyıllar boyunca toprak altında kaldı, toprak tarafından sıkıştırıldı, değişen hava koşullarıyla ıslandı ve kurudu, kazı sırasında parçalandı. Yazılar sıklıkla soluk, kırık ya da eksik; kemik yüzeyleri ise kazınmış vuruşlara aldatıcı biçimde benzeyen çatlaklar ve lekelerle dolu. Geleneksel yaklaşımlar ya her işareti gözle titizlikle karşılaştıran uzmanlara dayanıyordu ya da temiz, modern basılı metinler için tasarlanmış standart karakter tanıma yazılımlarına. Tek bir karakterin bir çatlakla bölünebileceği, kısmen aşınabileceği ya da farklı yazıcılar ve dönemler tarafından hafifçe farklı şekillerde çizilebileceği durumlarında her iki yaklaşım da zorlanıyor. Sonuç olarak, bu malzemenin büyük bölümü hangi karakterin hangisi olduğunu belirlemenin güçlüğü nedeniyle yeterince kullanılamıyor.

Bilgisayarlara Hasarın Ötesini Görmeyi Öğretmek

Prism-OBI bu sorunu tek bir uçtan uca model kullanmak yerine dikkatle koordine edilmiş iki aşamaya ayırarak ele alıyor. İlk aşamada sistem, bir kemiğin rubbing (sürtmeyle alınmış) görüntüsünde karakterlerin nerede olduğuna odaklanıyor; ne anlama geldikleriyle ilgilenmiyor. Herhangi bir yapay zeka görüntüye bakmadan önce, iki aşamalı bir temizleme işlemi kontrastı artırıyor ve tarayıcıdan kaynaklanan lekeli gürültüyü filtreleyerek vuruşların daha belirgin hale gelmesini sağlıyor. Temizlenen rubbing, hızlı bir nesne algılama ağına dayanan ve “yıpranma farkındalığı” için yeniden tasarlanmış özelleştirilmiş bir algılayıcıya veriliyor. Bu algılayıcı geniş biçimleri ince ayrıntılardan ayırıyor, olası vuruş desenlerini öne çıkarıyor, rastgele çatlakları geri plana itiyor ve hem küçük hem büyük karakterlerin güvenilir biçimde tespit edilebilmesi için farklı ölçeklerdeki bilgileri birleştiriyor. Bu aşamanın çıktısı, her bir şüpheli karakter alanı etrafında sıkı kutulardan oluşan bir küme oluyor.

Figure 1
Figure 1.

Kırpılmış İşaretlerden Tanınmış Karakterlere

İkinci aşamada her bir kırpılmış karakter alanı standart bir kareye yeniden boyutlandırılıyor ve yaygın kullanılan bir görsel modelden uyarlanmış derin bir sinir ağı sınıflayıcısına veriliyor. Bu sınıflayıcı, her biri modern Çince karşılığıyla ilişkilendirilmiş 306 kategoride 300.000’den fazla oracle kemik karakteri içeren OBC306 veri kümesindeki yüzlerce ince farkı ayırt etmede uzmanlaşıyor. Algılayıcı zaten karakterleri temizleme ve izole etme zorluğunu üstlendiği için sınıflayıcı vuruş şekli ve yerleşimindeki—küçük kancalar, kırılmalar veya kesişimler gibi—ince ayrımlara odaklanabiliyor; orijinal rubbing’in arka plan gürültüsüyle mücadele etmek zorunda kalmıyor. Testler, odaklanmış bir algılayıcı ile güçlü bir sınıflayıcının eşleştirilmesinin, daha basit tek aşamalı sistemlerden daha yüksek tanıma doğruluğu verdiğini ve hâlâ gerçek zamanlıya yakın kullanım için yeterince hızlı çalıştığını gösteriyor.

Figure 2
Figure 2.

Yeni Algılayıcının İç Yapısına Bakış

Perdenin arkasında, Prism-OBI’nin algılayıcısı aşırı bozulmuş eserlerle başa çıkmak için bir dizi uyarlanmış hile kullanıyor. Bir modül görsel sinyali düşük frekanslı bileşenlere (genel konturlar) ve yüksek frekanslı bileşenlere (keskin kenarlar) ayırıyor; böylece model geniş biçimleri ve ince vuruş uçlarını farklı şekilde işleyebiliyor ve ardından rastgele çatlaklar yerine tutarlı vuruş desenlerini vurgulamak için dikkat mekanizmaları uyguluyor. Başka bir modül farklı ölçeklerde bir bakış piramidi oluşturuyor ve her ölçeğe ne kadar güvenileceğini öğreniyor; bu da hem küçük hem de büyük karakterlerin tespitini gürültüyle boğulmadan iyileştiriyor. Üçüncü bir modül, katmanları basitçe üst üste yığmak yerine farklı ağ katmanlarından gelen özelliklere ağırlık vermeyi öğreniyor; bu, bilgilendirici sinyalleri korurken güvenilmez olanları bastırmaya yardımcı oluyor. Son olarak, algılama başlığı yatay ve dikey konumu açıkça kodluyor; bu, bitişik karakterlerin aksi halde birbirine karıştığı kalabalık düzenlerde hayati önemde.

Kültürel Miras İçin Sonuçların Anlattıkları

Standart bir oracle kemik algılama veri kümesinde, geliştirilmiş algılayıcı temel modele kıyasla kutu doğruluğu, geri çağırma ve genel kaliteyi önemli ölçüde iyileştiriyor; böylece hem kaçırılan karakterler hem de çatlaklardan kaynaklanan yanlış alarmlar azalıyor. Sınıflayıcı ile birleştirildiğinde, Prism-OBI çerçevesi dizin başına yaklaşık 32 görüntüyü bir dizüstü bilgisayar GPU’sunda işleyerek güçlü karakter tanıma performansı sergiliyor. Erken nitel testler, aynı algılayıcının yeniden eğitme olmadan bronz yazıtlar ve mühür yazısı gibi diğer antik yazı türlerinde de anlamlı şekilde karakter yerelleştirebildiğini gösteriyor; yine de en iyi sonuçlar için ince ayar gerekli. Uzman olmayanlar için ana çıkarım şudur: Prism-OBI, ağır hasarlı antik yazıları otomatik olarak okumaya yönelik pratik ve genişletilebilir bir yol sunuyor. “Yazı nerede?” sorusunu “Ne diyor?” sorusundan net biçimde ayırarak, sistem dağınık, kırılmış kemik yüzeylerini yapılandırılmış, aranabilir metne dönüştürüyor ve tarihçiler ile arkeologların insanlığın en eski yazılı kayıtlarını her zamankinden daha hızlı ve kapsamlı şekilde keşfetmelerine yardımcı oluyor.

Atıf: Li, J.W., He, J.R., Wu, J.R. et al. Prism-OBI: a novel framework for oracle bone inscription recognition via visual perception and feature decoupling. npj Herit. Sci. 14, 218 (2026). https://doi.org/10.1038/s40494-026-02493-9

Anahtar kelimeler: oracle kemik yazıtları, antik yazı tanıma, derin öğrenme, kültürel mirasın dijitalleştirilmesi, bilgisayarlı görü