Clear Sky Science · tr

Eskiden Köleleştirilmiş Kişilerin Sesleri: Eskiden Köle Olmuş Kişilerin Anlatılarından Yeni Bir Metin Korpusu

· Dizine geri dön

Uzun Süre Susturulmuş Hikâyeleri Duymak

Nesiller boyunca köleleştirilmiş ve eskiden köle olmuş kişilerin günlük yaşamları çoğunlukla plantasyon kayıtları, nüfus tabloları ve köle sahiplerinin sesleri aracılığıyla anlatıldı. Bu makale, köleliği bizzat yaşamış olanları doğrudan dinlemenin yeni bir yolunu sunuyor: yaşam öyküleri ve röportajlardan oluşan geniş, açık erişimli dijital bir koleksiyon. Hassas kitapları ve eski daktilo nüshalarını dikkatle aranabilir bir kaynağa dönüştürerek, proje tarihçilerden meraklı okuyuculara kadar herkesin insanın esaret ve özgürlük deneyimlerini nasıl anlattığını keşfetmesini çok daha kolay hâle getiriyor.

Figure 1
Figure 1.

Birçok Sesi Tek Bir Yerde Toplamak

Projenin merkezinde “Eskiden Köle Olmuş Kişilerin Sesleri” adlı bir metin korpusu var. Bu korpus, Amerika Birleşik Devletleri ve Karayipler’in bazı bölgelerinden iki ana kaynak türünü bir araya getiriyor. Birinci tür, çoğu 1800’lerde yayımlanmış ve Documenting the American South koleksiyonunda korunmuş olan, köleydiğini bildiren kişilerin yaklaşık iki yüzinci şahıs otobiyografisini içeriyor. İkinci tür ise 1930’larda Federal Writers’ Project tarafından gerçekleştirilen ve yaşlı kadın ve erkeklerin kölelikte geçen çocukluklarını anımsadıkları iki binden fazla röportajdan oluşuyor. Bu metinlerin tamamı kamu malı statüsünde ve ekip gerektiğinde dijitalleştirilmiş sürümlerin yeniden kullanımına izin aldı.

Eski Sayfalardan Akıllı Veriye

Tarihî sayfaları güvenilir dijital metne dönüştürmek hiç de basit değil. Önceki dijitalleştirme çabaları pek çok hata getirmiş: harflerin rakam olarak okunması, sözcük sırasının karışması ve tutarsız yazım düzeltmeleri. Araştırmacılar bu nedenle materyali modern optik karakter tanıma aracından yeniden geçirip Library of Congress ve Project Gutenberg gibi çeşitli sürümleri karşılaştırdılar. Karakterlerin ve tüm sözcüklerin ne sıklıkla yanlış okunduğunu ölçtular, ardından süreci ince ayarlamak için titizlikle kontrol edilmiş “altın” transkripsiyonlar kullandılar. Bu, hangi yaklaşımların en doğru sürümleri ürettiğini ve hangi alanların hâlâ manuel düzeltme gerektirdiğini belirlemelerini sağladı.

Figure 2
Figure 2.

Anlam Katmanları Eklemek

Temel metin iyi bir durumda olduğunda ekip onu birçok ek bilgi katmanıyla zenginleştirdi. Bir dil işleme hattı kullanarak cümle sınırlarını, sözcük türlerini, sözlük formlarını ve dilbilgisel ilişkileri işaretlediler. Ayrıca kişi ve yer adlarını tanımlamaya başladılar ve bir röportajın ne zaman ve nerede kaydedildiği, baş konuşmacının cinsiyeti ve bir sayfanın basılı standart İngilizceyi mi yoksa konuşma ağızlarını yakalamaya dönük bir girişimi mi yansıttığı gibi ayrıntılı meta veriler oluşturdular. Röportaj yapanların dönemin Afrikalı Amerikalı konuşmasını kaydediş biçimlerine özel dikkat gösterildi; bu konuşma genellikle “going” yerine “gwine” gibi standart dışı yazımlarla görünür ve bilgisayarların analiz etmesini zorlaştırabilir.

Dil ve Deneyimi Keşfetmek

Bu teknik katmanlar hem tarih hem dil üzerine yeni bakış açıları açıyor. Artık milyonlarca kelime düzenlenmiş ve açıklamalı olduğuna göre araştırmacılar kalıp aramak için geniş çaplı sorgular çalıştırabiliyor: insanların iş, aile, cezalandırma veya özgürlük hakkında nasıl konuştukları ve bu kalıpların zaman içinde ya da yerden yere nasıl değiştiği. Benzer anlamdaki kelimeleri kümelere ayıran kelime-gömme modelleri gibi ilk deneyler hâlihazırda ince ayrımlar ortaya koydu. Örneğin, eskiden köle olmuş kişilerin birinci şahıs anlatılarında “man” ve “person” gibi terimler genellikle arka plan farkı gözetmeksizin insanları ifade etme eğilimindeyken, çağdaş diğer metinlerde “man” daha çok beyaz öznelere, “person” ise Afrikalı Amerikalılara daha yakın bağlanıyor. Böyle bulgular, korpusun dilin ırk ve statüyü nasıl kodladığına ışık tutabileceğini gösteriyor.

Paylaşılan Miras İçin Yaşayan Bir Kaynak

Makalenin temel çıktısı tek bir tarihî iddia değil, kalıcı ve açıkça paylaşılan bir araştırma kaynağıdır. Korpusun 0.1 sürümü belgeler, örnek analizler ve çalışmayı yeniden üretmek veya genişletmek için kodla birlikte şimdiden erişilebilir durumda. Gelecek sürümler daha fazla röportaj, daha zengin coğrafi bilgi, konu ve duygulanım analizleri ile keşfi kolaylaştıracak ek araçlar ekleyecek. Genel okuyucu için ana mesaj, dağınık arşivlere uzun süredir hapsedilmiş seslerin artık dikkatle toplanıp temizlendiği ve güçlendirildiğidir. Bu dijital korpus, eskiden köle olmuş kişilerin sözlerini ortak kültürel mirasımızın bir parçası olarak koruyor ve bilim insanlarının, öğrencilerin ve halkın kendi yaşamları hakkında söylemeyi seçtiklerinden öğrenmesini çok daha kolay hâle getiriyor.

Atıf: Elmerot, I., Olsson, LJ. & Rönnbäck, K. Volces of formerly enslaved: A new text corpus of narratives by formerly enslaved persons. Sci Data 13, 682 (2026). https://doi.org/10.1038/s41597-026-07340-x

Anahtar kelimeler: köle anlatıları, dijital beşeri bilimler, tarihsel dilbilim, Afrikalı Amerikalı tarihi, metin korpusu