Clear Sky Science · ar
هل يمكن لتوزيعات احتمالية أطوال الجمل والعبارات التفريق بين اتجاهات الترجمة؟
لماذا يهم طول الجمل في الترجمة
عندما نقرأ قصة مترجمة، قلما نتوقف للتفكير في اللبنات الصغيرة للنص: كم طول كل جملة أو عبارة، أو كم تتكرر أطوال معينة. مع ذلك، يمكن لهذه الأنماط أن تكشف بهدوء عن هوية المترجم والاتجاه الذي تمت فيه الترجمة — إلى اللغة الأم للمترجم أم إلى لغة ثانية. يستكشف هذا المقال ما إذا كانت البصمات الإحصائية لأطوال الجمل والعبارات قادرة على التمييز بين اتجاهات الترجمة بدقة أكبر من المتوسطات البسيطة، مقدمة عدسة جديدة لفهم كيف تختلف اللغة المترجمة عن الكتابة العادية.

النظر أبعد من المتوسطات البسيطة
لسنوات، استخدم الباحثون طول الجملة كمؤشر تقريبي على أسلوب الكتابة وهوية المؤلف وحتى النوع الأدبي. ركزت الدراسات المبكرة على مقاييس أساسية مثل متوسط عدد الكلمات في الجملة، لكن هذه المقاييس غالبًا ما كانت خشنة للغاية لحسم مسائل مثل من كتب نصًا متنازعًا عليه. تحول العمل الأحدث إلى التوزيعات الكاملة — كم مرة تظهر الجمل القصيرة والمتوسطة والطويلة — لاكتشاف أنماط أدق. تتبنّى الدراسة الحالية هذا النهج التوزيعي في ميدان دراسات الترجمة، متسائلة عمّا إذا كان بإمكانه إلقاء ضوء على مسألة اتجاه الترجمة المثيرة للجدل: الترجمة إلى اللغة الأم (L1) مقابل الترجمة إلى لغة ثانية (L2).
مجموعة قصصية مطابقة بعناية
لاختبار هذه الفكرة، بنى الباحثون موزوعًا محكَمًا يعتمد على عشر قصص قصيرة للكاتب الصيني المؤثر لو شون. تحتوي كل قصة على عدة ترجمات إنجليزية قام بها أربعة مترجمين محترفين. اثنان منهم متحدثون أصليون للإنجليزية يترجمون من الصينية (ترجمة إلى اللغة الأم، L1)، واثنان متحدثون أصليون للصينية يترجمون إلى الإنجليزية (ترجمة إلى لغة ثانية، L2). باستخدام سكربتات حاسوبية مخصصة، قسّم الباحثون النصوص الإنجليزية إلى جمل ووحدات أصغر تسمى عبارات، ثم حسبوا عدد الكلمات في كلٍ منها. حسبوا المتوسطات البسيطة، لكن الأهم من ذلك أنهم نمذجوا التوزيع الكامل للأطوال باستخدام توزيعات احتمالية معروفة في اللسانيات الكمية.
ما تكشفه أنماط الجمل
المفاجأة الأولى هي أن متوسط طول الجملة يكاد يكون متماثلًا في ترجمات L1 وL2، والاختبارات الإحصائية لا تظهر فرقًا ذا دلالة. على السطح، ينتج كلا الفريقين جملًا بطول إجمالي مشابه. ومع ذلك، عندما يفحص المؤلفون كيف تتوزع أطوال الجمل، تظهر تناقضات خفية. عندما يجمعون الجمل في فئات (مثل 1–5 كلمات، 6–10 كلمات، وهكذا) ويناسبون توزيعًا متقدمًا يعرف باسم نموذج ذي الحدين الموجب الموسع (Extended Positive Negative Binomial)، تختلف اثنان من معلمات النموذج باستمرار بين ترجمات L1 وL2. بعبارة بسيطة، كلا الاتجاهين يفضّلان الجمل متوسطة الطول، لكن شكل "التلة" بالضبط والطريقة التي تتناقص بها التكرارات نحو الجمل القصيرة جدًا أو الطويلة جدًا تحمل دلائل قوية عن اتجاه الترجمة.
ما تضيفه أنماط العبارات
العبارات، الوحدات الأصغر داخل الجمل، تروي قصة أكثر دقة. هنا، يختلف المتوسط: الترجمة إلى لغة ثانية تميل إلى أن تحتوي على عبارات أطول قليلًا وتباين أكبر. ومع ذلك، تتأثر هذه المتوسطات بشدّة بأسلوب كل مترجم، مما يقيد فائدتها في تصنيف الاتجاه. عندما يفحص المؤلفون نمط الرتبة–التكرار لأطوال العبارات (كم مرة يظهر الطول الأكثر شيوعًا، ثم الثاني، وهكذا) ويناسبون توزيعًا يسمى نموذج الهايبر بواسون (Hyperpoisson)، تظهر معلمات النموذج حساسية عالية لاتجاه الترجمة وتلتقط أيضًا بصمات أسلوبية فردية. في المقابل، عندما ينظرون إلى طول العبارة من زاوية أخرى — نمط الطول–التكرار المناسب لنموذج شنتون–سكيز–الهندسي (Shenton–Skees–geometric) — فإن المعلمات لم تعد تميز الاتجاهات جيدًا، رغم أنها لا تزال تعكس اختلافات أسلوبية بين المترجمين.

لماذا تهم هذه الأنماط الخفية
بشكل عام، تُظهر الدراسة أن المتوسطات البسيطة لطول الجملة أو العبارة أدوات خشنة لفهم الترجمة. إن الشكل الاحتمالي الكامل لأنماط الأطوال هو ما يحمل الإشارة الأكثر إفادة. تبرز مجموعتان بعينها كقوية بشكل خاص: توزيع الطول–التكرار لأطوال الجمل وتوزيع الرتبة–التكرار لأطوال العبارات. معًا، يمكن لهذه النماذج أن تحدد بثقة ما إذا كانت الترجمة قد أُنجزت إلى لغة أم إلى لغة ثانية، حتى عندما تبدو النصوص متشابهة سطحيًا. للقراء غير المتخصصين، الرسالة هي أن الترجمات تحمل آثارًا إحصائية دقيقة لكيفية إنتاجها — آثار يمكن للحواسيب قراءتها حتى لو لم يشعر بها البشر مباشرة. قد تساعد هذه التقنيات في النهاية في تقييم جودة الترجمة، وبناء ملفات تعريف لأساليب المترجمين، أو التمييز بين الترجمة البشرية والآلية، مع تعميق فهمنا لكيفية تصرّف اللغة عند انتقالها بين لِسَان وآخر.
الاستشهاد: Zhan, J., Fu, Y. & Jiang, Y. Can probabilistic distributions of sentence and clause lengths differentiate between translation directions?. Humanit Soc Sci Commun 13, 412 (2026). https://doi.org/10.1057/s41599-026-06737-8
الكلمات المفتاحية: اتجاه الترجمة, توزيع طول الجملة, طول العبارة, اللسانيات الكمية, ترجمات لو شون