Clear Sky Science · tr
Palmiye yaprağı belgelerinde metin satırı segmentasyonu için bir kıyas veri kümesi
Yapraklara Yazılmış Hikâyeleri Korumak
Palmiye yaprağı el yazmaları, Güney ve Güneydoğu Asya’da yaşam, bilim, din ve sanatla ilgili hayatta kalan en eski kayıtlar arasındadır. Bu kırılgan yaprakların birçoğu şimdi soluyor, çatlıyor ve zamanla aşınarak yüzlerce yıllık bilgilerin kaybolma riskiyle karşı karşıya. Bu makale, hasarlı palmiye yapraklarındaki yazı satırlarını bilgisayarların daha doğru okumasına yardımcı olan, özenle oluşturulmuş bir dijital veri kümesi olan LeafOCR-Line’ı sunuyor; bu sayede bu kırılgan mirası koruma ve paylaşma çabları hızlanıyor. 
Neden Antik Yapraklar Okunması Zor?
Bir palmiye yaprağı el yazmasını okumak modern basılı bir sayfayı taramaktan çok daha basit değildir. Yazı sık sık eğik olur, dar alanlara sıkıştırılmıştır veya yaprakların bağlanmasında geleneksel olarak kullanılan deliklerle bölünmüştür. Yaş, lekeler, mantar izleri, yırtıklar ve solmuş mürekkep ekler. Bu işaretlerin bazıları harflara şaşırtıcı derecede benzer görünürken, gerçek harflerin parçaları eksik veya zar zor görülebilir. Bu metinlerin çoğunda kullanılan Malayalam gibi dillerde harfler döngüler ve üst üste binen işaretlerle doludur; bu durum bir satırdan diğerine örtüşmeye yol açar. Her yazı satırını tespit etmeye çalışan bir bilgisayar görüş sistemi için bu dağınık ve örtüşen düzen özellikle zorlayıcıdır.
Fiziksel Yapraklardan Dijital Kıyaslamaya
Yazarlar, dijitalleştirme zincirindeki kritik adımlardan biri olan arka plandan ve bitişik satırlardan her metin satırını ayırmaya odaklanan büyük, gerçekçi bir kıyas veri kümesi oluşturmayı amaçladılar. Yaklaşık olarak 1000 ile 1800 yılları arasında yazılmış eserleri kapsayan, halka açık çevrimiçi bir koleksiyondan 20 bağılmış Malayalam palmiye yaprağı demeti topladılar. Neredeyse 3.000 sayfa görüntüsü çıkardıktan ve otomatik olarak koyu arka planları kırptıktan sonra yalnızca yaprak bölgeleriyle çalıştılar. Her kırpılmış yaprak boyut bakımından büyük ölçüde değişir, üç ila on iki satır metin içerir ve bir veya iki delik, düzensiz boşluklandırma ve farklı yazarlar ile dönemleri yansıtan çeşitli el yazısı stilleri barındırabilir.
Hasarı Sınıflandırmak ve Her Satırı İzlemek
Farklı hasar düzeyleri farklı işleme stratejileri gerektirdiğinden, her görüntü üç kalite düzeyinden birine atandı: daha az bozulmuş, orta derecede bozulmuş veya ağır derecede bozulmuş. Bu derecelendirme, görsel netlik, kontrast ve fiziksel durumu analiz eden önceden belirlenmiş nesnel bir değerlendirme yöntemine dayandı. LeafOCR-Line’ın esas yeniliği yazı satırlarının nasıl işaretlendiğindedir. Satırların üstüne veya altına uzanan harfleri sıklıkla kesen basit dikdörtgenler çizmek yerine, ekip her satırın gerçek eğimli şeklini yakından izleyen esnek çokgen konturlar kullandı. 
Veri Kümesi Neler İçeriyor
Toplamda LeafOCR-Line, her biri metin satırlarını vurgulayan eşleşen bir maske görüntüsüyle eşleştirilmiş 1.710 palmiye yaprağı görüntüsü sunar. Koleksiyon, üç kalite düzeyinin benzer oranlarını koruyacak şekilde eğitim, doğrulama ve test alt kümelerine bölünmüştür: görüntülerin yaklaşık yarısı orta derecede bozulmuşken, geri kalanlar daha iyi ve daha kötü durumlar arasında yaklaşık olarak eşit biçimde dağılmıştır. Bu 1.710 yapraktan araştırmacılar 10.000’den fazla bireysel satır görüntüsü çıkarabilir. Ek dosyalar her görüntü için hasar düzeyini ve kaynak el yazmasını özetler; orijinal çevrimiçi depoya geri bağlantılar içerir. Bu yapı, yöntemleri adil bir şekilde karşılaştırmayı ve farklı hasar derecelerine uyum sağlayan sistemler tasarlamayı kolaylaştırır.
Günümüz Algoritmaları Ne Kadar Başarılı?
Veri kümesinin hem zorlayıcı hem de kullanışlı olduğunu göstermek için yazarlar klasik kodlayıcı–kod çözücü ağlardan daha yeni dönüştürücü (transformer) tabanlı tasarımlara kadar geniş bir modern görüntü segmentasyonu model setini eğitti ve test etti. Her modelin öngördüğü satır bölgelerinin insan yapımı maskelere ne kadar yaklaştığını ölçtüler. Tüm modeller satırları makul bir doğrulukla ayırabildi, ancak DeepLabV3 adındaki bir yaklaşım öne çıktı. İnce, eğimli satırları yakalama ve ağır hasarlı yapraklarda bile sürekliliği koruma konusunda özellikle etkiliydi; yine de satırların çok yaklaştığı yerlerde küçük hatalar kaldı. U-Net ve LinkNet gibi diğer popüler modeller de güçlü performans sergiledi, ancak en kötü vakalarda biraz daha tutarsız kaldılar; bazı dönüştürücü tabanlı ve piramit tarzı ağlar ise ince ayrıntılarla baş etmekte zorlandı.
Bir Yazıdan Birçok Yazıya ve Neden Önemli
LeafOCR-Line yalnızca Malayalam yazısını içeriyor olsa da, harflerin şekilleri ve düzeni Tamil, Tigalari ve Grantha gibi komşu yazılarla benzerlik gösterir. Yazarlar, veri kümesi üzerinde eğitilmiş bir modelin bu ilişkili yazılardan satırları ayırabildiğini göstererek aynı verilerin birkaç dilde daha geniş dijitalleştirme çabalarını destekleyebileceğini ortaya koydu. Uzman olmayanlar için ana mesaj basit: LeafOCR-Line, hasarlı palmiye yapraklarındaki metin satırlarını “görebilen” algoritmalar oluşturmak ve test etmek için sağlam, herkese açık bir temel sunar. Bu da arşivcilerin, kütüphanecilerin ve toplulukların kırılgan, solmaya yüz tutmuş bitki materyali parçalarını arama yapılabilir, paylaşılabilir dijital arşivlere dönüştürmesine yardımcı olarak kültürel belleği gelecek nesiller için canlı tutar.
Atıf: Sivan, R., Pati, P.B. A benchmark dataset for text line segmentation in palm leaf documents. Sci Data 13, 424 (2026). https://doi.org/10.1038/s41597-026-06718-1
Anahtar kelimeler: palmiye yaprağı el yazmaları, metin satırı segmentasyonu, belge dijitalleştirme, Malayalam yazısı, mirasın korunması