Clear Sky Science · tr

Tsinghua bambu şeritlerinin yazıcı doğrulaması için Seyamese ağlar

· Dizine geri dön

Antik kitaplar modern kodla buluşuyor

Kağıt ve ekranlardan çok önce Çinli düşünürler ince bambu şeritlere yazı yazıyorlardı. Bugün bu kırılgan el yazmaları tarihçiler için hazine değeri taşıyor, ancak temel bir soru şaşırtıcı derecede zor: hangi şeritler aynı el tarafından yazıldı? Bu çalışma arkeoloji ile yapay zekâyı harmanlayarak Tsinghua Üniversitesi’nin ünlü koleksiyonundaki 2.300 yıllık binlerce bambu şeridin kimin tarafından yazıldığını çözmede araştırmacılara yardımcı olabilecek dijital bir asistan oluşturuyor.

Figure 1
Figure 1.

El yazısının önemi neden büyük

Tsinghua bambu şeritleri, Çin’in ilk imparatorluğundan hemen önceki Savaşan Devletler dönemine tarihlenir. Bunlar siyaset, tarih ve felsefe üzerine, daha sonraki geleneği şekillendiren ya da ondan kopmuş erken metinlerin izlerini taşır. Bu yazıları gerçekten anlamak için araştırmacıların şeritlerin nasıl gruplaştığını, hangi parçaların aynı el yazmasına ait olduğunu ve kaç yazıcının çalıştığını bilmeleri gerekir. Geleneksel olarak uzmanlar bu soruları eğrilik, kalınlık, baskı ve düzen gibi çizgi özelliklerini göze bakarak değerlendirerek yanıtlar. Bu ustalık yavaş, öznel ve yeni buluntular ortaya çıktıkça ölçeklendirmesi zor bir süreçtir.

Çizgileri veriye dönüştürmek

Yazarlar bilgisayara, şeritlerin yüksek çözünürlüklü fotoğraflarından kesilen tek tek el yazısı karakterlerini karşılaştırmayı öğretmeyi hedeflediler. Önce geniş bir görsel koleksiyon oluşturdular: daha önce paleografik çalışmalarla belirlenmiş 11 yazara ait olduğu kabul edilen toplam 15.745 tekil karakter. Profesyonel görüntü işleme yazılımlarıyla arka plan gürültüsü kaldırıldı, her karakter bir dikdörtgen içine izole edildi ve hasarlı ya da örtüşen işaretler elendi. Ardından az örneğe sahip sınıfları dengelemek için küçük sınıfların görüntüleri çevirme, döndürme, kırpma ve gürültü ekleme gibi basit yöntemlerle çoğaltıldı; böylece algoritma daha yaygın stillere eğilimli olmayacaktı.

Benzerlik arayan ikiz bir ağ

Bilgisayardan her karakterin yazarını adlandırmasını istemek yerine ekip daha kolay ama daha esnek bir soru yöneltti: bu iki görüntü aynı elden mi? Bunu yapmak için parametreleri paylaşılan, birbirinin aynı iki görüntü işleme dalından oluşan bir “Seyamese” sinir ağı kullandılar. Her dal bir karakter görüntüsünü kompakt bir sayısal parmakizine dönüştürüyor. Sistem daha sonra iki parmakizi arasındaki mesafeyi ölçüyor: küçük mesafeler aynı yazıcıya işaret ederken, daha büyük mesafeler farklı yazarlara işaret ediyor. Her dalın merkezinde, en anlamlı görsel özellikleri—ince kıvrımlar, çizgi kalınlığı veya karakter parçalarını oluşturma tercihleri gibi—vurgulamayı öğrenen bir dikkat mekanizmasıyla geliştirilmiş hafif bir model olan MobileNet_V3+’ın yükseltilmiş bir versiyonu bulunuyor; daha az faydalı ayrıntıları ise geri plana atıyor.

Figure 2
Figure 2.

Sistemin performansı nasıl

Tsinghua veri setinde, modelin en iyi versiyonu iki karakterin aynı yazara ait olup olmadığını yaklaşık %90 doğrulukla tahmin etti ve iki kategorili ayrımda standart bir testte çok yüksek bir skor elde etti. Sınırlı veriye aşırı uyum sağlama veya ince stil ipuçlarını yakalayamama eğiliminde olan ResNet, VGG ve Vision Transformers gibi daha ağır görüntü tanıma sistemlerini geride bıraktı. Ağın “dikkat haritalarının” görsel incelemeleri, eğitim ilerledikçe modelin genel siluete bakmayı bıraktığını ve insan uzmanlar gibi kilit çizgi bölümlerine odaklandığını gösterdi.

Gerçek akademik tartışmaların çözümüne katkı

Araçun laboratuvar dışında da işe yarayıp yaramadığını görmek için yazarlar uzun yıllardır yazarlığı tartışılan birkaç bambu elyazmasına uyguladılar. Üç metin için (“Ji Gong”, “Hou Fu” ve “She Ming”) önceki araştırmacılar giderek bunların daha geniş “Yin Zhi” grubunda aynı yazara ait olduğuna inanmışlardı. Model bu görüşü kuvvetle destekledi ve tüm eşleştirmelerde çok yüksek benzerlik buldu. Başka bir elyazması çiftinde, “Zhi Zheng” ve “Zhi Bang” üzerinde tek bir yazıcının mı yoksa birkaç yazıcının mı çalıştığı tartışılmıştı. Ağın karşılaştırmaları “Zhi Zheng”in 1–42. sayfalarının tek bir yazı stili oluşturduğunu, ancak “Zhi Zheng”in 43. sayfasının hem 1–42 ile eşleşmediğini hem de “Zhi Bang” ile yakından uyuştuğunu gösterdi—daha önce tanımlanmış herhangi bir kategoriye girmeyen iki ayrı yazara dair kanıt.

Geçmiş ve gelecek için anlamı

Daha açık bir ifadeyle bu çalışma, kompakt bir yapay zekâ sisteminin antik el yazısının çok küçük parçalarının muhtemelen aynı kişiye ait olup olmadığını, yalnızca tek tek karakterleri görse bile, güvenilir şekilde söyleyebileceğini gösteriyor. Uzman yargısını yerine geçmeyecek, fakat büyük koleksiyonları hızla tarayabilir, muhtemel eşleşmeleri işaretleyebilir ve şeritlerin belirli gruplanmaları lehine veya aleyhine nicel kanıt sunabilir. Tsinghua koleksiyonunun ötesinde, aynı yaklaşım kehanet kemiklerinden İpek Yolu el yazmalarına kadar diğer kırılgan belgelerde de uyarlanarak tarihçiler ve dilbilimcilerin fikirlerin zaman ve mekân içinde nasıl yayıldığını yeniden kurmalarına yardımcı olabilir.

Atıf: Wang, H., Li, M., Liu, B. et al. Tsinghua bamboo slip scribe verification using Siamese networks. npj Herit. Sci. 14, 147 (2026). https://doi.org/10.1038/s40494-026-02416-8

Anahtar kelimeler: bambu şeritleri, el yazısı analizi, derin öğrenme, kültürel miras, Seyamese ağ