Clear Sky Science · ar
SCAD: التعلم التبايني الذاتي للإشعار بالاستعارات في الشعر الصيني الكلاسيكي
رسائل مخفية في الأبيات القديمة
تفيض القصائد الصينية الكلاسيكية بالإشارات الخفية إلى قصص مشهورة وأساطير وشخصيات تاريخية. تضيف هذه «الاستعارات» عمقاً عاطفياً وغنى ثقافياً، لكنها تجعل القصائد صعبة الفهم للقراء المعاصرين — وللآلات أيضاً. يقدم هذا البحث نظام ذكاء اصطناعي جديداً، SCAD، قادرًا على اكتشاف هذه الإشارات المطمورة تلقائياً وعلى نطاق واسع، ما يفتح الباب لأدوات رقمية أكثر ذكاءً لقراءة وتعليم وبحث الأدب الصيني.
لماذا تهم الاستعارات في الشعر
لعدة قرون اعتمد الشعراء الصينيون على الاستعارات كشكل من الاختصار الأدبي. بالإيحاء إلى قصة معروفة — مثل قرية مخفية idيلية أو إلهة نهر حزينة — كانوا قادرين على التعبير عن مشاعر معقدة في عدد قليل من الحروف. المشكلة أن هذه الإيحاءات غالباً ما تكون دقيقة. قد لا تذكر القصيدة اسم القصة التي تستند إليها؛ بل تستحضر مكاناً أو شيئاً أو صورة مرتبطة بالتقليد. ونظراً لأن الكلمة نفسها قد تشير إلى قصص مختلفة اعتماداً على السياق، تكافح أنظمة الحاسوب المتقدمة للتعرّف بشكل موثوق أي استعارة تستخدمها القصيدة، خصوصاً عندما تكون هناك آلاف المرشحين وإمكانات تدريب معنونة محدودة.

تعليم الآلات عبر المقارنات
يتعامل المؤلفون مع هذا التحدي باستراتيجية تسمى التعلم التبايني الذاتي، معدلة خصيصاً للنصوص الصينية الكلاسيكية. بدلاً من مطالبة البشر بوضع وسم لكل قصيدة بالإشارة الصحيحة، بنوا مجموعة كبيرة من أزواج القصيدة–الاستعارة من موقع موثوق يوثق كيف تقتبس أكثر من 14,000 قصيدة 1,025 استعارة محددة. لكل زوج حقيقي — قصيدة تستخدم فعلاً قصة معينة — يولدون تلقائياً أزواج «سالبة» بمطابقة نفس القصيدة مع استعارات غير ذات صلة. يتعلم SCAD تمييز الزوج الحقيقي عن الزائف عن طريق تقريب نصوص القصيدة والاس ت عارة ذات الصلة في فضاء التمثيل الداخلي لديه وإبعاد غير المرتبطة.
نموذج مصمم للنصوص الصينية القديمة
تقوم بنية SCAD على SikuBert، نموذج لغوي درّب على مجموعات كبيرة من الكتابات ما قبل الحديثة الصينية. يُدخل النظام كل من القصيدة والاستعارة (بما في ذلك المقطع المصدر الأصلي) في مُشَفِّر مشترك، مما يمكّن النموذج من التركيز على كيفية تفاعل عبارات معينة في القصيدة مع تفاصيل القصة. تُضاف وحدات "محول" خفيفة إلى هذا المُشَفِّر بحيث تحتاج عملية التكييف إلى عدد صغير من المعاملات الجديدة فقط، ما يجعل الضبط الدقيق فعالاً. وتمنح دالة خسارة محسنة وزناً إضافياً لأصعب الأمثلة السالبة — أي الاستعارات المضللة التي قد يغري النموذج باختيارها — بحيث يتعلم SCAD من أخطائه الأكثر شيوعاً بدلاً من الحالات السهلة فقط.
تفوق على الأساليب القائمة
عند اختباره مقابل مجموعة من البدائل — بما في ذلك أنظمة التعلم العميق السابقة والأساليب القائمة على القواعد وحتى نماذج لغوية كبيرة عامة الهدف — يثبت SCAD تفوقه بدقة أكبر عند تسمية الاستعارة الصحيحة في القصيدة. لا يكتفي برتبة الإجابة الصحيحة أعلى في المتوسط فحسب، بل يحددها أيضاً كخيار أول في حوالي أربع حالات من كل خمس حالات اختبار، وهو تقدم واضح على التقنيات السابقة. تُظهر دراسات الإزالة أن كل خيار تصميمي يساهم في الأداء: التدريب المسبق على اللغة الكلاسيكية بدلاً من الحديثة، تضمين النص المصدر الكامل للاستعارة، إضافة المحولات، وإعادة وزن الأمثلة السالبة الصعبة كلها تحسّن الأداء، لا سيما في الاستعارات النادرة أو الدقيقة.

اكتشاف روابط جديدة وبناء خرائط معرفة
بعيداً عن الدقة الخام، يستكشف المؤلفون كيف يمكن لـSCAD أن يعمم ويشرح قراراته. في اختبارات «الصفر لطلقات» (zero-shot)، يزيلون عمداً بعض الاستعارات الشهيرة وكل القصائد ذات الصلة من التدريب، ثم يطلبون من SCAD التعرف عليها رغم ذلك. لا يزال النظام يؤدي أداءً قوياً، ما يشير إلى أنه تعلم أنماطاً عامة حول كيفية إيحاء الشعراء بالقصص بدلاً من حفظ قائمة ثابتة. لعرض أسباب هذه القرارات، يطبق الفريق طريقة قابلية التفسير تسمى LIME، التي تبرز الكلمات المحددة في القصيدة التي تؤثر أكثر على توقع SCAD. باستخدام هذه الإشارات، يستخرجون ما يقرب من 10,000 «كلمة استعارة» ويجمعونها في رسم بياني معرفي يربط القصائد والعبارات المستحضة بالقصص التي تستحضرها — مورد يمكن أن يدعم البحث وأدوات الدراسة والاختبارات التفاعلية.
جلب الإيحاءات القديمة إلى العصر الرقمي
في الجوهر، يبيّن هذا العمل أنه بالإشارات والبنية المناسبة للتدريب، يمكن للآلات أن تبدأ في التقاط الإيماءات والإيحاءات الأدبية المضمنة في الشعر الصيني الكلاسيكي. لا يكتفي SCAD بالكشف عن أي قصة تستحضرها القصيدة بهدوء، بل يمكنه أيضاً أن يعمم لاستدلال استعارات جديدة ويساهم في رسم خريطة الشبكة المعقدة من الإشارات التي تربط القصائد ببعضها وبالتقليد الثقافي الأوسع. بالنسبة للقراء والطلاب والباحثين، قد تصبح الأنظمة المبنية على هذا النهج مرشدين يضيئون الطبقات الخفية من المعنى في بعض من أكثر الأدب غنىً بالاستعارات في العالم.
الاستشهاد: Shi, B., Bu, W., Li, X. et al. SCAD: self-supervised contrastive learning for allusion detection in Chinese poems. Humanit Soc Sci Commun 13, 293 (2026). https://doi.org/10.1057/s41599-026-06627-z
الكلمات المفتاحية: الشعر الصيني الكلاسيكي, الإشارات الأدبية, التعلم التبايني, العلوم الإنسانية الرقمية, معالجة اللغة الطبيعية