Clear Sky Science · ar

BA-RILA لتمييز موضوعات الشعر الصيني القديم قائم على دمج ميزات نصية متعددة الأبعاد

· العودة إلى الفهرس

لماذا يهم تعليم الحواسيب قراءة القصائد القديمة

تحمل القصائد الصينية القديمة قروناً من المشاعر والتاريخ والحياة اليومية، لكن لغتها تختلف كثيراً عن الصينية الحديثة حتى إن الخبراء أنفسهم قد يختلفون في تفسير معانيها. مع رقمنة المزيد من المكتبات والمتاحف لهذه الأعمال، يزداد الحاجـة إلى أدوات ذكية قادرة بسرعة على فرز القصائد حسب الموضوع، ما يساعد الباحثين والطلاب والجمهور على استكشاف مجموعات هائلة. تقدم هذه الدراسة طريقة جديدة لتمكين الحواسيب من التعرف على موضوع القصيدة القديمة، باستخدام ليس فقط معنى الكلمات بل أيضاً الإيقاع والصور الشعرية لالتقاط روح الشعر الكلاسيكي بصورة أفضل.

تحويل القصائد الكلاسيكية إلى بيانات

لتعليم الحاسوب الشعر، كان على الباحثين أولاً بناء مجموعة بيانات مناسبة. جمعوا نحو 10,000 قصيدة من سلالات صينية رئيسية، لا سيما تانغ وسونغ، وصنّفوا كل واحدة بعناية إلى ستة موضوعات عامة مثل الصداقة والوداع، التاريخ والحنين، المناظر والطبيعة، الحب والزواج، الحنين إلى الوطن، والحدود والحرب. أزالوا النصوص الضوضائية أو غير المكتملة، وقسموا اللغة الكلاسيكية، وفلتروا كلمات الوظيفة التي لا تحمل كثيراً من المعنى. أظهرت تحليلات سحابة الكلمات أن لكل موضوع مفرداته المميزة، ما يؤكد أن الوسوم تطابقت جيداً مع المحتوى الشعري.

Figure 1. كيف يصنف الذكاء الصناعي مجموعات كبيرة من القصائد الصينية القديمة إلى موضوعات باستخدام المعنى والصوت والصور.
Figure 1. كيف يصنف الذكاء الصناعي مجموعات كبيرة من القصائد الصينية القديمة إلى موضوعات باستخدام المعنى والصوت والصور.

دمج المعنى والصوت والصور

تركز معظم تقنيات اللغة على معنى الكلمات وحده، لكن الشعر الصيني الكلاسيكي يعتمد أيضاً بشكل كبير على أنماط الصوت والصور الرمزية. يجمع نموذج BA-RILA الجديد بين ثلاثة أنواع من المعلومات. أولاً، يستخدم نسخة من نموذج اللغة الشهير BERT تم إعادة تدريبه على الصينية القديمة، بحيث يفهم الحاسوب نحواً وتراكيب عتيقة وتعابير كلاسيكية أفضل. ثانياً، يقيس الإيقاع باستخدام أحد عشر خاصية رقمية تلتقط القافية وطول الأبيات وأنماط النغم وبنية الأزجاق، مما يعكس كيفية صوت وتوازن الأبيات. ثالثاً، يتتبع الصور الشعرية عبر وصف مكوّن من 75 عنصراً مبنياً على 25 رمزاً ذا أهمية ثقافية، مثل الصفصاف للوداع أو القمر للحنين، لكل منها تكرار ونبرة عاطفية وقوة الظهور داخل القصيدة.

كيف يتعلم النموذج من القصيدة كاملة

تختلف هذه التيارات الثلاثة من المعلومات في مدى التمثيل، لذا يقوم النظام أولاً بخريطتها إلى فضاء مشترك ويستخدم آلية انتباه داخلية ليقرر مقدار الوزن الذي يمنحه للدلالة والإيقاع والصور لكل قصيدة. ثم تمر الميزات المندمجة عبر طبقتين من شبكة متكررة ثنائية الاتجاه تقرأ القصيدة إلى الأمام والخلف، ملتقطةً كيفية تطور المعنى عبر الزمن. يبرز وحدة انتباه متعددة الرؤوس الأجزاء الأكثر إفادة من هذا التمثيل من خلال النظر إليها من عدة زوايا في آن واحد. أخيراً، تحول مجموعة من الطبقات الموصولة بالكامل هذه الصورة الداخلية الغنية إلى احتمالات على الستة مواضيع، لتحديد الموضوع الأنسب لكل قصيدة.

Figure 2. كيف يمزج نموذج الذكاء الصناعي المعنى والإيقاع والصور الشعرية خطوة بخطوة ليحدد موضوع قصيدة واحدة.
Figure 2. كيف يمزج نموذج الذكاء الصناعي المعنى والإيقاع والصور الشعرية خطوة بخطوة ليحدد موضوع قصيدة واحدة.

مدى فاعلية النظام

تُظهر اختبارات واسعة أن BA-RILA يتفوق بوضوح على عدة نماذج معيارية قوية تعتمد فقط على BERT الحديث، أو على الشبكات التفافية، أو على تصميمات متكررة أبسط. في مهمة الستة موضوعات، يصل الأسلوب الجديد إلى دقة تقارب 97 بالمئة، مع أداء مستقر حتى في الموضوعات الأقل شيوعاً. عندما أزال المؤلفون أجزاء فردية من النظام، مثل BERT المكيف للصينية القديمة، أو دمج الإيقاع والصور، أو الطبقات المتكررة، أو وحدة الانتباه، انخفض الأداء بشكل ملحوظ، مما يدل على أن كل جزء يساهم بشكل ذي مغزى. تعامل النموذج أيضاً مع قصائد من فترة تانغ وسونغ، رغم أنه وجد شعر سونغ أصعب بعض الشيء لأن إيقاعاته أقل انتظاماً ولغته أكثر تشتتاً.

ماذا يعني هذا لاستكشاف الأدب الكلاسيكي

لغير المتخصصين، الخلاصة الأساسية هي أن الجمع بين معنى الكلمات والصوت والصور الرمزية يسمح للحواسيب بفرز القصائد القديمة حسب الموضوع بطريقة تعكس ممارسات القراءة التقليدية بشكل أفضل. بدلاً من اعتبار الشعر مجرد نص عادي، يحترم نهج BA-RILA طابعه الموسيقي وصوره الثقافية، مما يؤدي إلى وسم آلي أكثر موثوقية. يمكن لمثل هذه الأدوات أن تسهل البحث في أرشيفات كبيرة، ومقارنة شعراء عبر السلالات، أو دراسة كيفية تطور موضوعات مثل الحنين إلى الوطن أو الحرب عبر الزمن، داعمةً البحث الأكاديمي وتقدير الجمهور للثقافة الصينية الكلاسيكية.

الاستشهاد: Zhang, X., Liu, Y. Multi-dimensional text feature fusion-based BA-RILA for ancient Chinese poetry theme recognition. Sci Rep 16, 16573 (2026). https://doi.org/10.1038/s41598-026-48986-2

الكلمات المفتاحية: الشعر الصيني القديم, تصنيف الموضوعات, دمج ميزات النص, صور شعرية, معالجة اللغة للتراث الثقافي