Clear Sky Science · ar

أصوات سابقًا المستعبدون: مجموعة نصية جديدة لسير الأشخاص الذين كانوا مستعبدين

· العودة إلى الفهرس

سماع قصص طالما بقيت صامتة

لطالما رويت حياة الأشخاص المستعبدين وسابقًا المستعبدين لأجيال، في الغالب من خلال سجلات المزارع، جداول التعداد، وأصوات ملاّك العبيد. تقدم هذه المقالة طريقة جديدة للاستماع مباشرة إلى أولئك الذين عاشوا تجربة العبودية: مجموعة كبيرة ومتاحة علنًا من قصص حياة ومقابلات بصيغة رقمية. من خلال تحويل الكتب الهشة والنسخ المطبوع القديمة إلى مورد قابل للبحث بعناية، يجعل المشروع من الأسهل بكثير لأي شخص—من المؤرخين إلى القراء الفضوليين—استكشاف كيف وصف الناس تجاربهم في العبودية والحرية.

Figure 1
الشكل 1.

جمع أصوات عديدة في مكان واحد

جوهر المشروع هو مجموعة نصية تُدعى «أصوات سابقًا المستعبدون». تجمع بين نوعين رئيسيين من المصادر من الولايات المتحدة وأجزاء من منطقة الكاريبي. الأول يتضمن ما يقرب من مئتي سيرة ذاتية بصيغة الشخص الأول لأشخاص كانوا مستعبدين، نُشرت معظمها أصلاً في القرن التاسع عشر وحُفظت في مجموعة توثيق جنوب الولايات المتحدة. والثاني يتكون من أكثر من ألفي مقابلة أُجريت في ثلاثينيات القرن العشرين ضمن مشروع كتّاب الفدرالي، حيث استعاد كبار السن ذكريات طفولتهم في العبودية. كل هذه النصوص ضمن الملكية العامة، وقد حصل الفريق على إذن لإعادة استخدام النسخ الرقمية عند الحاجة.

من صفحات قديمة إلى بيانات ذكية

تحويل الصفحات التاريخية إلى نص رقمي موثوق ليس أمرًا بسيطًا. أدت محاولات الرقمنة السابقة إلى أخطاء كثيرة: حروف قُرئت كأرقام، ترتيب كلمات مُشوَّه، وتصحيحات تهجئة غير متسقة. لذلك أعاد الباحثون تشغيل المواد عبر أداة تعرف ضوئي حديثة على الحروف وقارنوا عدة نسخ، بما في ذلك تلك من مكتبة الكونغرس ومشروع غوتنبرغ. قاسوا مدى تكرار أخطاء قراءة الحروف والكلمات بأكملها، ثم استخدموا نصوصًا «ذهبية» مُدققة بعناية لضبط العملية. أتاح لهم ذلك تحديد أي الطرق أنتجت نسخًا أدق وأين كانت لازمة مزيد من التصحيحات اليدوية.

Figure 2
الشكل 2.

إضافة طبقات من المعنى

بعد أن أصبح النص الأساسي في حالة جيدة، enrichedالفريق النص بمزيد من طبقات المعلومات. باستخدام خط أنابيب لمعالجة اللغة، وضعوا علامات على حدود الجمل، أنواع الكلمات، الأشكال المعجمية، والعلاقات النحوية. كما بدأوا بتحديد أسماء الأشخاص والأماكن وأنشأوا بيانات وصفية مفصلة، مثل متى وأين سُجلت المقابلة، نوع المتحدث الرئيسي، وما إذا كانت الصفحة تعكس الإنجليزية المطبوعة المعيارية أو محاولة لالتقاط العامية المنطوقة. أولوا اهتمامًا خاصًا للطريقة التي دوّن بها المحاورون خطاب الأمريكيين الأفارقة في ذلك الوقت، والذي يظهر غالبًا في تهجئات غير معيارية مثل «gwine» بدلًا من «going» وقد يصعب على الحواسب تحليله.

استكشاف اللغة والتجربة

تفتح هذه الطبقات التقنية نوافذ جديدة على كل من التاريخ واللغة. مع تنظيم الملايين من الكلمات وتوضيحها الآن، يستطيع الباحثون إجراء بحث واسع النطاق عن أنماط: كيف تحدث الناس عن العمل والعائلة والعقاب أو الحرية، وكيف تغيرت تلك الأنماط عبر الزمن أو من مكان لآخر. أظهرت تجارب مبكرة باستخدام نماذج تضمين الكلمات—أدوات تجمع الكلمات بحسب التشابه الدلالي—تمييزات دقيقة بالفعل. على سبيل المثال، في السرد بصيغة الشخص الأول لأشخاص سبق استعبادهم، تميل مصطلحات مثل «man» و«person» إلى الإشارة إلى الناس بغض النظر عن الخلفية، بينما في نصوص معاصرة أخرى يرتبط «man» أكثر بموضوعات بيضاء و«person» بالأمريكيين الأفارقة. تشير هذه النتائج إلى أن المجموعة النصية يمكن أن تسلّط الضوء على كيفية ترميز اللغة للعرق والمرتبة الاجتماعية.

مورد حي للتراث المشترك

النتيجة الرئيسية للمقال ليست ادعاء تاريخي واحد بل مورد بحث متين ومشترك متاح علنًا. النسخة 0.1 من المجموعة النصية متاحة بالفعل، مكتملة بالوثائق، تحليلات أمثلة، وشفرة لإعادة إنتاج العمل أو توسيعه. ستضيف الإصدارات المستقبلية المزيد من المقابلات، معلومات جغرافية أغنى، تحليلات موضوعية وانفعالية، وأدوات استكشاف إضافية. بالنسبة للقارئ العام، الرسالة الأساسية هي أن الأصوات التي طالما حُصرت في أرشيفات متفرقة تُجمَع الآن بعناية، تُنقّى، وتُعزَّز. تحافظ هذه المجموعة الرقمية على كلمات الأشخاص سابقًا المستعبدين كجزء من تراثنا الثقافي المشترك وتسهل كثيرًا على العلماء والطلاب والجمهور التعلم مما اختار هؤلاء قوله عن حياتهم.

الاستشهاد: Elmerot, I., Olsson, LJ. & Rönnbäck, K. Volces of formerly enslaved: A new text corpus of narratives by formerly enslaved persons. Sci Data 13, 682 (2026). https://doi.org/10.1038/s41597-026-07340-x

الكلمات المفتاحية: سير العبيد, العلوم الإنسانية الرقمية, اللسانيات التاريخية, تاريخ الأمريكيين من أصل إفريقي, مجموعة نصية