Clear Sky Science · ar

دمج الإشارات غير النصية مع معالجة اللغة التقليدية للكشف المحسّن عن انتشار الأخبار المزيفة متعددة الوسائط

2026-04-09 · العودة إلى الفهرس

لماذا أصبح اكتشاف الأخبار المزيفة أصعب

تصلنا الأخبار اليومية الآن عبر الهواتف والموجزات الاجتماعية، حيث تنتقل القصص الحقيقية والوهمية جنبًا إلى جنب بسرعة عالية. كثير من المنشورات المزيفة تبدو وتقرأ كصحافة حقيقية، ما يجعل من الصعب التقاطها باستخدام أدوات تكتفي بقراءة الكلمات فقط. تقدّم هذه الدراسة طريقة جديدة لأجهزة الحاسوب لتقييم القصص على الإنترنت ليس عبر قراءة النص فحسب، بل أيضًا بمراقبة كيفية مشاركة الناس لها وبنية الأسلوب نفسه، بهدف تمييز المعلومات المضللة بدقّة وسرعة أكبر.

Figure 1. كيف يمكن لدمج ما تقوله المنشورات وطريقة انتشارها أن يكشف الأخبار المزيفة في موجزات مواقع التواصل الاجتماعي.

النظر إلى ما وراء الكلمات على الشاشة

ركزت أغلب أنظمة كشف الأخبار المزيفة السابقة على مصدر واحد للمعلومات، عادة نص المقال. كانت تحسب تكرار الكلمات، وتدرس أسلوب الكتابة، أو تستخدم نماذج لغوية حديثة لفهم المعنى. تعمل هذه الأنظمة جيدًا في الحالات البسيطة، لكنها تعاني عندما تقلّد القصص المزيفة نبرة ومفردات المصادر الموثوقة بعناية. بدأ باحثون آخرون بإضافة إشارات إضافية من وسائل التواصل الاجتماعي، مثل عدد مرات المشاركة أو هوية الذين يشاركون المنشور، لكنهم غالبًا ما جمعوا كل هذه الإشارات معًا دون تقييم أيها أهم لكل قصة على حدة. تجادل الدراسة الجديدة بأن كلًا من المحتوى وطريقة الانتشار يحملان دلائل، وأن نظامًا مرنًا يجب أن يقرر في الوقت الفعلي أي الأدلة يَثق بها أكثر.

ثلاثة أنواع من الأدلة لكل عنصر إخباري

صمم الباحثون نموذجًا يفحص كل منشور إخباري من خلال ثلاث عدسات مختلفة في آن واحد. أولًا، يحسب إحصاءات مهندسة حول النص وعن الحساب الذي نشره، مثل مدى تكرار إعادة النشر أو التعليق من المتابعين، وتوقيت الإرسال، ومدى استخدام علامات الترقيم أو الوسوم. ثانيًا، يركز على مستوى الحروف الفردية، مفككًا الكلمات إلى سلاسل حرفية قصيرة لكي يتعرّف على الأنماط عندما يستخدم الناس العامية، أو تهجئات مبتكرة، أو أخطاء مقصودة. ثالثًا، ينظر في معاني الكلمات، محوّلًا كل كلمة إلى متجه رقمي يلتقط طريقة استخدامها في اللغة اليومية. كل عدسة تحوّل نتائجها إلى ملخّص مضغوط باستخدام شبكة عصبية صغيرة خاصة بها، بحيث يتم ترشيح التفاصيل المشوشة قبل دمج الأدلة.

Figure 2. كيف تعمل ثلاث مسارات من الأدلة حول منشور ما معًا داخل نموذج لتقرير ما إذا كانت الأخبار حقيقية أم مزيفة.

ترك النظام يختار ما يثق به

بدلًا من تجميع كل هذه الملخصات ببساطة، يستخدم النموذج آلية تسمى الانتباه الذاتي لوزنها بشكل مختلف لكل قصة. عمليًا، يعني ذلك أن النظام يتعلم متى يعتمد أكثر على سلوك المستخدمين، ومتى يركّز على معنى الكلمات، ومتى يستند إلى أنماط الحروف. على سبيل المثال، إذا بدا المنشور لغويًا طبيعيًا لكنه انتشر عبر نمط مشاركة مريب، يمكن لفرع السلوك أن يأخذ وزنًا أكبر. تتبادل الفروع الثلاثة المعلومات عبر درجات الانتباه ثم تُجمَع في متجه قرار واحد، يغذّي مصنفًا نهائيًا يوسم الخبر كحقيقي أو مزيف. يحافظ هذا التصميم على عدد معقول من معلمات النموذج نسبيًا، مما يجعله سريعًا بما يكفي للمراقبة في الوقت الحقيقي.

ما مدى فعاليته على بيانات وسائل التواصل الحقيقية

اختبر الفريق منهجهم على مجموعتين شائعتين مبنيتين على تويتر. الأولى، المسماة GossipCop، تغطي إشاعات الترفيه؛ والأخرى، PolitiFact، تحتوي مزاعم سياسية. في كلتا المجموعتين تفوّق النموذج كثيرًا على الأساليب السابقة التي استخدمت النص فقط، أو السلوك فقط، أو مركبات بسيطة منهما معًا. على مجموعة GossipCop وسم نحو 99 بالمئة من العناصر بشكل صحيح، وعلى مجموعة PolitiFact الأكثر صعوبة وصل إلى نحو 96 بالمئة دقة. كما ثبتت فعاليته تحت اختبارات أصعب، مثل إضافة أخطاء مطبعية بنمط لوحة المفاتيح إلى النص أو طلب الحكم على منشورات سياسية بنموذج درّب على أخبار المشاهير. في هذه الحالات، ساعدت دلائل مستوى الحرف والسلوك في الحفاظ على جزء كبير من الأداء عندما انهارت النماذج المعتمدة على الكلمات وحدها.

ماذا يعني هذا لقراء الأخبار العاديين

تُظهر الدراسة أن كشف الأخبار المزيفة الموثوق يجب أن يهتم ليس فقط بما تقوله القصة، بل أيضًا بكيفية كتابتها وكيف تتحرك عبر الشبكة الاجتماعية. من خلال مزج هذه الرؤى وترك النظام يكيّف أهميتها حالة بحالة، يمكن للنموذج المقترح أن يعلّم المنشورات المشبوهة بثقة عالية مع بقائه خفيف الوزن بما يكفي لنشره على منصات مباشرة. بالنسبة للمستخدمين العاديين، هذا لا يغني عن القراءة الدقيقة أو التحقق البشري من الحقائق، لكنه قد يعمل كطبقة إنذار مبكر تبطئ انتشار القصص المضللة قبل أن تصل إلى جماهير واسعة.

الاستشهاد: Dang, J., Sun, Y. & Yu, C. Fusing non-textual cues with classical NLP for enhanced multimodal fake news spread detection. Sci Rep 16, 16193 (2026). https://doi.org/10.1038/s41598-026-45735-3

الكلمات المفتاحية: الأخبار المزيفة, وسائل التواصل الاجتماعي, المعلومات المضللة, التعلّم العميق, التحليل متعدد الوسائط