Clear Sky Science · ar

OBIMD: مجموعة بيانات متعددة الوسائط لتفسير سياقي لنقوش عظام الأوراكل

· العودة إلى الفهرس

فك الرسائل من عظامٍ قديمة

قبل أكثر من ثلاثة آلاف عام، نقش المنجمون الملكيون في الصين أسئلة للأرواح على عظام الحيوانات وصدفات السلاحف، ثم سخنوها حتى تشققَت. تحافظ هذه العظام ذات النقوش على بعض أقدم أشكال الكتابة الكاملة في العالم، لكنها اليوم باقية كشظايا هشة متناثرة في المتاحف والكتب. تقدم هذه الدراسة OBIMD، مجموعة رقمية جديدة تجمع بين الصور والقراءات الخبيرة لهذه النقوش، مما يمنح المؤرخين والحواسيب على حد سواء وسيلة قوية لدراسة كيفية عمل هذا الخط القديم وما يكشفه عن المجتمع الصيني المبكر.

Figure 1
Figure 1.

لماذا يصعب قراءة العظام القديمة

عظام الأوراكل ليست صفحات نصية مرتبة. هي مشققة ومحترقة وغالبًا ما تكون مكسورة إلى قطع، والكتابة تلتف حول السطح المنحني في اتجاهات محيرة. نادرًا ما يتعامل الباحثون مع الأصول مباشرة. بدلاً من ذلك، يعتمدون على ثلاثة أنواع من البدائل: نسخ احتكاك داكنة مأخوذة من سطح العظمة، ونسخ تخطيطية مرسومة يدويًا توضح الضربات، ونصوص مطبوعة تعكس كيف يعتقد الخبراء أنه ينبغي قراءة النص. حتى الآن، كانت معظم المجموعات الرقمية تعامل الحروف المفردة المقتطعة من النسخ الاحتكاكية كصور معزولة. هذا مفيد لتدريب الحواسيب على التعرف على الأشكال، لكنه يتجاهل السياق الأوسع الذي يستخدمه الخبراء البشر فعليًا لفك رموز العلامات المشوشة أو المتضررة.

خريطة رقمية غنية لكل عظمة منقوشة

تغير OBIMD هذه الصورة من خلال التعامل مع كل عظمة كعالم صغير منظم بذاته. لأكثر من عشرة آلاف نقش، يقدم المؤلفون نسخة احتكاك مطابقة وصورة تخطيطية، ثم يحددون موقع كل حرف مقروء بمستطيل تحديد. كما يسجلون الأماكن التي يكون فيها الحرف مفقودًا بوضوح لأن العظمة انكسرت، ويضعون مربعات فارغة خاصة كعناصر نائبة. تُجمع هذه الحروف والفجوات في جمل أو وحدات وظيفية أخرى، ويُدوّن ترتيب القراءة — الذي غالبًا ما يكون حلقيًا وغير خطي — صراحةً ضمن البيانات. ونتيجة لذلك، لا تكتفي مجموعة البيانات ببيان الأشكال الظاهرة على العظمة، بل توضح أيضًا كيف تشكل خطوطًا من النص، وما التسلسل الذي تتبعه، وأين فُقد النص.

Figure 2
Figure 2.

دمج الخبرة البشرية والمساعدة الآلية

كان صنع خريطة مفصّلة بهذا القدر لآلاف النقوش المعقّدة مستحيلًا بالجهد اليدوي وحده. صمم الفريق منصة ويب تسمح لأشخاص ذوي مستويات متباينة من التدريب بالعمل معًا بكفاءة. أولاً، تفحص أدوات رؤية الحاسوب صور النسخ الاحتكاكية والتخطيطية لتقترح أين قد تكون الحروف وأي مدخلات في مكتبة أحرف متخصصة تشبهها. ثم يقوم المعلّقون غير المتخصصين بتنقيح هذه الاقتراحات بمقارنة الصور والاطلاع على صفحات ممسوحة ضوئيًا من النصوص الخبيرة. يراجع طلاب الدراسات العليا المدربون في دراسات عظام الأوراكل عملهم، ويحل الخبراء المخضرمون القضايا الصعبة، مثل العلامات المتضررة بشدة أو القراءات المتنازع عليها. يضمن هذا النهج متعدد المستويات جودة عالية مع جعل مهمة التعليق الضخمة قابلة للإدارة.

تعليم الحواسيب قراءة الكتابة القديمة

لاختبار ما تمكّنه OBIMD، استخدمه المؤلفون لتدريب واختبار نماذج تعلم آلي حديثة على عدة مهام مستوحاة من كيفية قراءة الخبراء البشر للعظام. تعلّم نموذج واحد تحديد مواقع الحروف والتعرف عليها مباشرة على الصور الكاملة، وليس فقط على مقاطع مقطوعة مسبقًا، فحقق أفضل أداء على الرسومات التخطيطية الأنظف وتعثّر أكثر مع المتغيرات الدقيقة في النسخ الاحتكاكية المزعجة. تعلّم نموذج آخر تجميع الحروف في جمل بناءً على مواقعها وأشكالها، ونجح في الغالب لكنه لا يزال يخلط بين الحدود عندما تتداخل أسطر النص. تُدرب نموذج ثالث على استعادة ترتيب القراءة الأصلي لحروف متناثرة داخل الجملة، فخمن الترتيب الصحيح في معظم الحالات واقترب في كثيرٍ من الأخرى. معًا، تُظهر هذه الاختبارات أن OBIMD يمكنها دفع التقدم وكشف التحديات المتبقية في القراءة الآلية للخطوط القديمة.

ماذا يعني هذا لصورتنا عن الماضي

للغير متخصصين، الرسالة الأساسية هي أن OBIMD يحوّل الآثار المتناثرة والهشة للكتابة الصينية المبكرة إلى مورد متماسك وقابل للقراءة آليًا. من خلال مطابقة الصور والرسومات الخبيرة وقراءات على مستوى الجملة، وعبر تمييز ما فُقد بعناية وكذلك ما بقي، تعكس مجموعة البيانات الطريقة التي يجمع بها الباحثون البشريون المعنى من القطع المتضررة. تفتح الباب أمام دراسات واسعة النطاق لتغير اللغة وممارسات الناسخين والحياة الملكية في أسرة شانغ، وتوفر ميدان اختبار صارم لأنظمة الذكاء الاصطناعي التي تهدف إلى قراءة الماضي. باختصار، ليست OBIMD ترجمة لعظام الأوراكل، لكنها الخريطة التفصيلية التي سيستخدمها المؤرخون والخوارزميات المستقبلية لاستكشافها.

الاستشهاد: Li, B., Yang, J., Liang, Y. et al. OBIMD: A Multi-modal Dataset for Contextual Interpretation of Oracle Bone Inscriptions. Sci Data 13, 681 (2026). https://doi.org/10.1038/s41597-026-06967-0

الكلمات المفتاحية: نقوش عظام الأوراكل, الكتابة القديمة, العلوم الإنسانية الرقمية, مجموعة بيانات متعددة الوسائط, التعرف النصي بالذكاء الاصطناعي