Clear Sky Science · ar

النحو كبصمة سلوكية: استخدام نماذج نحوية مدفوعة إدراكياً للتحقق من تأليف النصوص

· العودة إلى الفهرس

لماذا أسلوبك في الكتابة يشبه بصمة الإصبع

في كل مرة تكتب فيها—سواء كانت رسالة بريد إلكتروني أو مراجعة أو منشور على وسائل التواصل—تكشف عن نفسك أكثر مما قد تظن. إلى جانب الموضوعات التي تختارها، تشكّل اللبنات الصغيرة لجملك، مثل الكلمات الصغيرة وعلامات الترقيم، أنماطاً شخصية بشكل مفاجئ. تستكشف هذه المقالة طريقة جديدة لاستخدام تلك الأنماط لمعرفة ما إذا كان نصان قد كتبهما نفس الشخص، مع آثار محتملة على القانون والأمن وفهمنا لكيفية وجود اللغة في العقل.

Figure 1
Figure 1.

كيف يقرر المحققون من كتب ماذا

في طب الشرعي النصي الرقمي، يواجه الخبراء غالباً أسئلة مثل: هل كتب نفس الشخص هذه الرسالة المهددة وهذه الرسالة السابقة؟ هل تتحكم حسابان على الإنترنت في شخص واحد؟ تندرج الطرق التقليدية لمشكلات التأليف في ثلاث تيارات. يقارن بعضهم نصوص الكاتب المعروف مع النص المتنازع فقط. يدرب آخرون مُصنِّفاً على أمثلة كثيرة لأزواج متطابقة وغير متطابقة. الوثبة الثالثة، التي يركّز عليها هذا البحث، تُدخِل "سكان مرجعيين" خارجيين من النصوص لفهم مدى ندرة أسلوب كتابة معين بالمقارنة مع كتّاب آخرين. خلال العقد الماضي، طغت تقنيات قوية لكنها غامضة—خاصة تلك القائمة على مقتطفات الحروف والشبكات العصبية العميقة—على المسابقات والمعايير المشتركة. مع ذلك، قد تكون بطيئة وصعبة التفسير، وأحياناً مدفوعة بالموضوع أكثر من العادات الأسلوبية الحقيقية للكاتب.

من العبارات إلى العادات في العقل

يؤسس المؤلفون طريقتهم الجديدة في علم اللغة الإدراكي، وهو مجال يَعتبر النحو ليس كمجموعة قواعد جامدة، بل كشبكة من الأنماط المكتسبة. وفقاً لهذا المنظور، يقوم عقلنا "بتجميع" التسلسلات المتكررة—مثل "of the" أو "I don’t know"—إلى وحدات تصبح تلقائية، تماماً كالخطوات الراقصة المرمَّسة. تقع هذه الوحدات على طيف من التعابير الثابتة إلى قوالب مرنة وهياكل أكثر تجريداً. وبما أن تجاربنا وتواريخ قراءتنا مختلفة، فإن التركيبات الخاصة التي ترسخت في أذهاننا تختلف أيضاً. يقترح هذا "مبدأ الفردية اللغوية" أنه لا يوجد شخصان يشتركان تماماً في نفس النحو الداخلي. يجادل البحث بأن هذا النحو المفرد يمكن أن يعمل كنوع من القياسات الحيوية السلوكية، شبيهة روحياً بالخط أو طريقة المشي.

تحويل النحو الخفي إلى إشارة قابلة للقياس

بناءً على هذه النظرية، يقدم المؤلفون LambdaG، طريقة تُنمذج نحو الكاتب مع تجاهل متعمد للموضوعات وكلمات المحتوى. أولاً، تُمرَّر النصوص عبر مرشح يحتفظ بالكلمات الوظيفية وعلامات الترقيم وبعض الفئات المجردة، مزيحاً الأسماء والمحتوى الخاص. تُقسّم هذه النصوص المفلترة إلى جمل وتُدخَل في نموذج إحصائي "ن-غرام" يتعلم احتمالية كل تسلسل صغير من الرموز النحوية بالنسبة لذلك الكاتب. تؤدي مجموعة ثانية من النماذج، المدربة على العديد من الكتّاب الآخرين، دور مجتمع المقارنة. لكل رمز في نص متنازع، تسأل LambdaG: إلى أي مدى هذا الرمز أكثر طبيعية في هذا السياق للمرشح مقارنةً بالكتّاب المرجعيين؟ تُجمَع هذه المقارنات في درجة واحدة تعكس كل من التشابه مع المرشح والندرة في المجتمع الأوسع. ثم يعيّر انحدار لوغستي بسيط هذه الدرجة حتى يمكن تفسيرها كمستوى قوة دليل في إعدادات جنائية.

Figure 2
Figure 2.

كيف تقارن الطريقة الجديدة بالأخرى

يختبر المؤلفون LambdaG على اثنتي عشرة مجموعة بيانات تُحاكي مواقف العالم الحقيقي: رسائل إلكترونية، سجلات دردشة، مراجعات، مقالات إخبارية، والمزيد، غالباً مع نصوص قصيرة نسبياً. يقارنونه بسبعة مرجعيات قوية، بما في ذلك طريقة المحتالين المؤثرة، نهج قائم على الضغط، مجموعة خالية من الموضوع، وعدد من أنظمة الشبكات العصبية العميقة. عبر مقاييس مثل الدقة ومساحة تحت منحنى ROC، تحتل LambdaG المرتبة الأولى في معظم مجموعات البيانات والثانية في عدة أخرى، متفوقة غالباً على النماذج العصبية حتى عندما سُمح لتلك النماذج باستغلال المحتوى الكامل. كما أنها أقل حساسية من الطرق السابقة لتغيرات المجتمع المرجعي: تنخفض الأداء عندما تأتي النصوص المرجعية من نوعية مختلفة جداً، لكن ليس إلى حد عدم الفاعلية. وبما أن درجة LambdaG يمكن تفكيكها جملة بجملة وحتى رمزاً برمز، يمكن للمحللين إنتاج خرائط حرارة تبرز بصرياً أي الأنماط في النص كانت الأكثر تأثيراً في القرار.

ما يعنيه ذلك للهوية والخصوصية

تخلص الدراسة إلى أن نحو الفرد—الطريقة التي ينسق بها عادة الكلمات الصغيرة، وعلامات الترقيم، والأنماط المتكررة—يعمل كثيراً كبصمة حيوية سلوكية. حتى في نص يتراوح بين ألف إلى ألفي كلمة، يمكن لـ LambdaG غالباً الكشف عن تسلسلات فردية تميّز شخصاً بشدة عن الآخرين، ويشير المؤلفون إلى أن العديد من هذه الوحدات ليست تحت سيطرة واعية للكتاب أنفسهم. لهذا فوائد واضحة لعمل الطب الشرعي: فهو يقدم طريقة بسيطة نسبياً، قوية تجريبياً ومؤسسة على نظرية لغوية متطورة، مما يجعل تفسيرها أسهل في المحكمة. وفي الوقت نفسه، يسلط ذلك الضوء على نقطة متعلقة بالخصوصية: كتابتنا اليومية تحمل بهدوء توقيعاً ثابتاً يمكن التعرف عليه، متجذراً ليس فيما نقول، بل في كيفية تعلم عقولنا قوله.

الاستشهاد: Nini, A., Halvani, O., Graner, L. et al. Grammar as a behavioral biometric: using cognitively motivated grammar models for authorship verification. Humanit Soc Sci Commun 13, 455 (2026). https://doi.org/10.1057/s41599-025-06340-3

الكلمات المفتاحية: التحقق من التأليف, الأسلوبية, اللسانيات الجنائية, القياسات الحيوية السلوكية, نمذجة النحو