Clear Sky Science · ar
تقييم الترجمة الأدبية بواسطة نماذج اللغة الكبيرة: تقييم جودة متعدد الأبعاد لرواية شين تشونغ ون «البلدة الحدودية»
لماذا تهم هذه الدراسة القراء والكتّاب
مع تحوّل أدوات مثل ChatGPT ونماذج اللغة الكبيرة الأخرى إلى جزء من الحياة اليومية، بدأ الناس يطرحون سؤالاً بسيطاً: هل يمكن لهذه الأنظمة أن تحل بالفعل محل المترجمين البشر، خاصة عند ترجمة الروايات المحبوبة؟ تتعمق هذه الدراسة في هذا السؤال من خلال فحص كيف تترجم عدة نماذج ذكاء اصطناعي رائدة كتاباً صينياً كلاسيكياً، «البلدة الحدودية» لشين تشونغ ون، إلى الإنجليزية ومقارنة أعمالها بترجمة بشرية محترمة.
قصة قرية تلتقي بالذكاء الاصطناعي
تشتهر «البلدة الحدودية» بصورتها اللطيفة للحياة الريفية في جنوب غرب الصين، ولغتها الشعرية، وشبكتها الكثيفة من العادات والمعتقدات المحلية. تجعل هذه السمات منها حالة اختبار مثالية: على أي مترجم أن يلتقط ليس فقط من فعل ماذا، بل إحساس الضباب فوق القوارب، إيقاع الأغاني الشعبية، وثقل القيم التقليدية. اختار الباحثون الفصلين الأولين من الرواية وجمعوا خمس نسخ إنجليزية: أربع أعدتها نماذج لغة كبيرة (GPT-4 وGPT-4o وGemini والنظام الصيني WXYY 4.0 Turbo) وواحدة للمترجم والعالم البشري جيفري كينكلي، التي تحظى نسخة 2009 منه بالتقدير لحساسيتها للأسلوب والثقافة.

كيف حُكم على الترجمات
للتجاوز عن الانطباعات الغريزية حول ما «يبدو صحيحاً»، استخدم الباحثون إطار عمل مفصلاً يسمى مقاييس الجودة متعددة الأبعاد. بدلاً من مجرد التحقق من مطابقة الصياغة مع الأصل، يصنف هذا النهج الأخطاء إلى أنواع ويقيّم مدى خطورتها. ركّز الفريق على ثلاثة أسئلة رئيسية: هل المعنى دقيق؟ هل تبقى النسخة وفية لنبرة المؤلف وأسلوب السرد؟ وهل تتعامل مع التفاصيل الثقافية بطريقة مفهومة للقراء دون محو نكهتها الأصلية؟ مع وضع ذلك في الاعتبار، قارن اثنان من المعلّقين المدربين كل جملة من النص الصيني بكل ترجمة، مع الإشارة إلى خمسة أنواع رئيسية من الأخطاء: الترجمة الخاطئة، الحذف، الإفراط في الترجمة (إضافة مواد غير ضرورية)، الترجمة الثقافية الخاطئة، ومشكلات على مستوى الخطاب الأوسع التي تضر بسير القصة.
أين تتعثر الآلات
تظهر النتائج أنماطاً واضحة. أفرزت الأنظمة الأربع إنجليزية سلسة، لكنها كثيراً ما أخفقت في التقاط الفروق الدقيقة الحاسمة. كانت الترجمة الخاطئة المشكلة الأكثر شيوعاً عبر الجميع: على سبيل المثال، تحولت العملات النحاسية القديمة إلى «نقد» بصياغة عصرية، ما غيّر بهدوء الإحساس التاريخي بالقرية. قدّمت Gemini أكبر قدر من الحذف، متخطية أحياناً عبارات وصفية تبرز الروابط بين الشخصيات أو تبني الجو العام. أمّا GPT-4 فكان غالباً ما يضيف لغة حكمية زائدة، فحوّل تلميحاً دقيقاً للرومانسية إلى «علاقة» مفتوحة، ما يغيّر نظرة القراء إلى الشخصيات. كانت الإشارات الثقافية هشة بشكل خاص: الأشياء اليومية المرتبطة بالحياة الطقسية، مثل البخور والشموع، أو اسم بطل أسطوري، غالباً ما سُطِّحت أو عُدِّلت لتبدو عصرية أو تُرجمت حرفياً بشكل مخل. وعلى مستوى الفقرات الكاملة، أعادت بعض النماذج ترتيب مركزية العناصر في الاستعارة أو المشهد بشكل طفيف، مما أضعف علاقات رئيسية، مثل الرابطة العاطفية بين الفتاة الصغيرة توي توي (تسويتسوي) وجدها.
نظرة أقرب إلى نقاط القوة النسبية
لم تؤدِ كل الأنظمة أداءً متساوياً. كان GPT-4o، النموذج الأحدث والأكثر تحسيناً، يرتكب أخطاء أقل باستمرار من GPT-4 في كل فئة تقريباً، ما يوحي بأن الضبط الدقيق يمكن أن يكون أكثر أهمية من حجم النموذج وحده. حذف محتوى أقل وترجم عبارات خاطئة أقل، وكان يميل إلى الحفاظ على تماسك القصة عبر الجمل. أما Gemini، فبرزت نقطة ضعفه الأكبر في الحذف، خصوصاً في المقاطع المليئة بالصور الأدبية واللمحات الثقافية. ولم يتجاوز نظام WXYY 4.0 Turbo، رغم تدريبه في سياق صيني، نظيريه الأجانب بوضوح في المقاطع ذات الثقل الثقافي؛ إذ ظل يعالج بعض المصطلحات التاريخية والطقسية كما لو كانت أشياء عصرية عادية. عبر كل هذه النسخ الآلية، بقيت الترجمة البشرية الأكثر موثوقية في نسج المعنى والمزاج والثقافة معاً.

ماذا يعني هذا لمستقبل القراءة المترجمة
بالنسبة للمهمات اليومية والنصوص المباشرة، تقدم نماذج اللغة الكبيرة بالفعل مساعدة مدهشة. لكن تُظهر هذه الدراسة أنه عندما يتعلق الأمر بالأعمال الأدبية مثل «البلدة الحدودية»، فإنها لا تزال تفقد طبقات حيوية من المعنى والشعور. يقترب أفضل نموذج أداءً، GPT-4o، أكثر من الآخرين لكنه ما زال يحتاج إلى إشراف بشري، خصوصاً في ما يتعلق بالثقافة وبنية السرد. يجادل المؤلفون بأن تحسين الموجهات، وتدريب أكثر تركيزاً، والتحرير البشري المنهجي ضرورية إذا كان من المقرر أن يدعم الذكاء الاصطناعي المترجمين الأدبيين بدلاً من أن يحلّ محلّهم. للقراء، الرسالة واضحة: يمكن أن يكون إنتاج الآلة مسودة مفيدة أو مساعداً، لكن الحياة العاطفية والثقافية الكاملة لرواية ما لا تزال تعتمد على الفن البشري.
الاستشهاد: Yang, W., Yang, M. Evaluating literary translation by large language models: a multidimensional quality assessment of Shen Congwen’s Border Town. Humanit Soc Sci Commun 13, 628 (2026). https://doi.org/10.1057/s41599-026-06868-y
الكلمات المفتاحية: الترجمة الأدبية, نماذج اللغة الكبيرة, جودة الترجمة الآلية, الأدب الصيني, الفروق الثقافية