Clear Sky Science · tr

OBIMD: Keşfedilebilir Bağlamla Orak Kemik Yazıtlarının Çoklu Modlu Bir Veri Seti

· Dizine geri dön

Antik Kemiklerden Gelen Mesajların Açığa Çıkması

Üç bin yıldan fazla bir süre önce Çin’de kraliyet falcıları ruhlara sorular kazımak için hayvan kemiklerine ve kaplumbağa kabuklarına işaretler yapıp sonra çatlamaları için ısıttılar. Bu orak kemikler, dünyanın en eski tam yazılarından bazılarını koruyor, ancak bugün müzeler ve kitaplar arasında dağılmış kırılgan parçalar halinde hayatta kaldılar. Bu çalışma, bu yazıtların görüntülerini ve uzman okumalarını bir araya getiren yeni bir dijital koleksiyon olan OBIMD’yi tanıtıyor; tarihçiler ve bilgisayarlar için bu antik yazının nasıl işlediğini ve erken Çin toplumuna dair neler açığa çıkardığını incelemenin güçlü bir yolunu sunuyor.

Figure 1
Figure 1.

Neden Eski Kemikler Okunması Zor

Orak kemikler düzenli metin sayfaları değildir. Çentikli, yanmış ve genellikle parçalara ayrılmıştır; yazı kıvrımlı yüzey boyunca kafa karıştırıcı yönlerde dolaşır. Bilginler nadiren orijinalleri kendileri eline alır. Bunun yerine üç tür vekile dayanırlar: kemiğin yüzeyinden alınan koyu mürekkepli frotaşolar, vuruşları netleştiren el çizimi facsimileler ve uzmanların metni nasıl okumaları gerektiğini gösteren basılı transkripsiyonlar. Bugüne dek çoğu dijital koleksiyon, frotaşolardan kesilip çıkarılmış tek tek karakterleri izole resimler olarak ele aldı. Bu, bilgisayarları şekilleri tanımaya eğitmek için faydalıdır, ancak insan uzmanların belirsiz veya hasarlı işaretleri çözerken kullandığı daha geniş bağlamı göz ardı eder.

Her Yazılı Kemik İçin Zengin Bir Dijital Harita

OBIMD bu tabloyu değiştirerek her kemiği kendi içinde küçük, yapılı bir dünya olarak ele alıyor. On binden fazla yazıt için yazarlar eşleştirilmiş bir frotaşo ve facsimile görüntüsü sağlıyor ve ardından her okunabilir karakterin konumunu sınırlayıcı kutu ile işaretliyorlar. Ayrıca bir karakterin kemik kırıldığı için açıkça eksik olduğu yerleri de kaydederek yer tutucu özel boş kutular koyuyorlar. Bu karakterler ve boşluklar cümlelere veya diğer işlevsel birimlere gruplanıyor ve sıklıkla döngüsel ve doğrusal olmayan okuma sıraları veride açıkça yazılıyor. Sonuç olarak veri seti yalnızca bir kemikte hangi şekillerin göründüğünü söylemekle kalmıyor; aynı zamanda bunların metin satırlarını nasıl oluşturduğunu, hangi sırayı izlediğini ve metnin nerelerde kaybolduğunu gösteriyor.

Figure 2
Figure 2.

İnsan Uzmanlığı ile Makine Desteğinin Birleşmesi

Böylesine ayrıntılı bir haritayı binlerce karmaşık yazıt için yalnızca elle oluşturmak imkansız olurdu. Ekip, farklı eğitim seviyelerine sahip kişilerin verimli şekilde birlikte çalışmasına izin veren web tabanlı bir platform tasarladı. Önce bilgisayar görüsü araçları frotaşo ve facsimile görüntülerini tarayarak karakterlerin nerede olabileceğini ve uzman bir karakter kütüphanesindeki hangi girdilere benzeyebileceğini öneriyor. Ardından uzman olmayan yorumlayıcılar bu önerileri görüntüleri karşılaştırarak ve uzman transkripsiyonların taranmış sayfalarına bakarak düzeltiyorlar. Orak kemik çalışmalarında eğitim almış yüksek lisans öğrencileri çalışmalarını gözden geçiriyor ve deneyimli uzmanlar kötü hasarlı işaretler veya tartışmalı okumalar gibi zorlu vakaları çözüyor. Bu katmanlı yaklaşım, kaliteyi yüksek tutarken anota­tion görevini yönetilebilir hâle getiriyor.

Bilgisayarlara Antik Yazıyı Okutmak

OBIMD’nin neler sağladığını görmek için yazarlar bunu kullanarak insan uzmanların kemikleri okuma biçiminden esinlenen birkaç görevde modern makine öğrenimi modellerini eğitip test ettiler. Bir model, yalnızca önceden kesilmiş yamalar üzerinde değil, tüm görüntülerde doğrudan karakterleri yerleştirmeyi ve tanımlamayı öğrendi; en iyi performansı daha temiz facsimile çizimlerde gösterirken, gürültülü frotaşolardaki ince varyantlarla en çok zorlandı. Başka bir model konum ve şekillere dayanarak karakterleri cümlelere gruplamayı öğrendi; çoğunlukla başarılı oldu ama metin satırları örtüştüğünde sınırları karıştırmaya devam etti. Üçüncü bir model ise bir cümle içindeki karışık karakterlerin orijinal okuma sırasını yeniden kurmak üzere eğitildi; çoğu durumda tam sırayı doğru tahmin etti ve birçok diğerinde de yakın sonuçlar elde etti. Birlikte bu testler OBIMD’nin hem ilerlemeyi hızlandırabileceğini hem de antik yazıların otomatik okunmasında hâlâ kalan zorlukları açığa çıkarabileceğini gösteriyor.

Geçmişe Dair Görüntümüz İçin Anlamı

Uzman olmayanlar için ana mesaj, OBIMD’nin dağılmış, kırılgan erken Çin yazısı izlerini tutarlı ve bilgisayar tarafından okunabilir bir kaynağa dönüştürdüğüdür. Görüntüleri, uzman çizimlerini ve cümle düzeyindeki okumaları hizalayarak ve neyin eksik olduğunu dikkatle işaretleyerek veri seti, insan bilginlerin hasarlı eserlerden anlamı nasıl bir araya getirdiklerini yansıtıyor. Bu, dil değişimi, yazıcı uygulamaları ve Shang hanedanlığındaki kraliyet yaşamı üzerine büyük ölçekli çalışmalara kapı açıyor ve geçmişi okumayı amaçlayan yapay zeka sistemleri için zorlu bir test alanı sunuyor. Kısacası OBIMD, orak kemiklerin bir çevirisi değil; gelecekteki tarihçiler ve algoritmaların onları keşfetmek için kullanacağı ayrıntılı haritadır.

Atıf: Li, B., Yang, J., Liang, Y. et al. OBIMD: A Multi-modal Dataset for Contextual Interpretation of Oracle Bone Inscriptions. Sci Data 13, 681 (2026). https://doi.org/10.1038/s41597-026-06967-0

Anahtar kelimeler: orak kemik yazıtları, antik yazı, dijital beşeri bilimler, çoklu modlu veri seti, Yapay Zeka metin tanıma