Clear Sky Science · ar
استغلال نماذج تحليل المواضيع لاستكشاف الأبعاد النفسية في بيانات وسائل التواصل الاجتماعي
لماذا تهم كلماتنا على الإنترنت
يناقش ملايين الناس مشاعرهم على وسائل التواصل الاجتماعي يوميًا، وغالبًا بشكل أكثر انفتاحًا ممّا يفعلون وجهًا لوجه. داخل بحر التعليقات العفوية هذا تختبئ دلائل قيّمة عن الصحة النفسية، بما في ذلك إشارات الاكتئاب أو الإيذاء الذاتي. تطرح هذه الدراسة سؤالًا بسيطًا ولكن له تبعات كبيرة: هل تستطيع تقنيات الذكاء الاصطناعي الحديثة فرز ضوضاء الحوار الإلكتروني، واكتشاف موضوعات ذات معنى، ومساعدة المتخصصين على فهم المخاطر النفسية بشكل أفضل—دون قراءة كل منشور على حدة؟

تحويل الفوضى إلى موضوعات
ركز الباحثون على مجموعة كبيرة من منشورات ريديت من مبادرة eRisk، التي تتضمن أشخاصًا صرّحوا بأنهم تم تشخيصهم بالاكتئاب ومجموعة مراقبة بلا تشخيص معروف. لم يكن الهدف تشخيص الأفراد، بل اختبار ما إذا كان تحليل المواضيع—تقنيات تجمع النصوص حسب المواضيع المشتركة—يمكن أن يكشف أنماطًا ذات صلة بالصحة النفسية. وبما أن لغة وسائل التواصل الاجتماعي فوضوية ومليئة بالعامية والأخطاء الإملائية وتقلبات الموضوع، فهي اختبار واقعي لكنه تحدي كبير لهذه الأساليب.
ثلاث طرق لاكتشاف ما يتحدث عنه الناس
قارن البحث بين ثلاث عائلات مختلفة من نماذج المواضيع. الأول، التخصيص الخفي ديريشليت (LDA)، هو طريقة كلاسيكية تنظر إلى تكرار ظهور الكلمات معًا في المستندات. الثاني، BERTopic، يستخدم نماذج لغة حديثة وقوية لتحويل كل منشور إلى تمثيل عددي غني، ثم يجمع المنشورات المشابهة ويستخرج كلمات مفتاحية لكل مجموعة. الثالث، TopClus، يعتمد أيضًا على الشبكات العصبية، جامعًا آليات الانتباه والتجميع في فضاء رياضي مشترك. تم تشغيل النماذج الثلاثة بإعداداتها القياسية لإنتاج 50 موضوعًا لكل منها، محاكاةً لكيفية استخدام العديد من الباحثين لها مباشرةً من دون تعديل واسع.
سؤال البشر، وليس الصيغ وحدها
للحكم على الموضوعات ذات المغزى الحقيقي، لم يعتمد الفريق على المقاييس الآلية وحدها. فحص ستة معنّقين مدرَّبين 150 موضوعًا، كل واحد ممثلًا بكلماته الأعلى وعدد من المنشورات المركزية. لكل موضوع، قيّموا مدى تماسك قائمة الكلمات، ومدى تماسك المنشورات النموذجية، وما إذا كانت الكلمات والمنشورات تتطابق مع بعضها. وحاولوا أيضًا إعطاء اسم قصير وبديهي لكل موضوع متى أمكن. كشف هذا النهج المرتكز على البشر عن نتيجة مهمّة: مقاييس "التماسك" الرقمية، الشائعة في البحوث، غالبًا ما تختلف مع حكم البشر، خصوصًا مع نصوص وسائل التواصل الاجتماعي الفوضوية.
الفائز الواضح وما كشفه
عبر جميع تقييمات البشر، برز BERTopic بوضوح كمنتج للموضوعات الأكثر قابلية للفهم والتحديد. استطاع المعنقون تسمية موضوعاته بمعدل أعلى بكثير مقارنة بالنماذج الأخرى، وكان هناك توافق معتدل وثابت بين تقييماتهم. في المقابل، غالبًا ما جمع LDA كلمات ومنشورات غير ذات صلة شعرت للمراجعين أنها عشوائية تقريبًا. بعد اختيار أفضل الموضوعات، استقصى الباحثون عن ما كان الناس يتحدثون عنه فعليًا. بعض الموضوعات، مثل "صراعات الصحة النفسية" و"الإيذاء الذاتي"، ارتبطت بقوة بالمستخدمين المصابين بالاكتئاب واحتوت على العديد من المنشورات التي تعبّر عن ضيق. وموضوعات أخرى أقل وضوحًا من الناحية السريرية—مثل "رحلة فقدان الوزن"، "الهوية الجنسانية"، "أحلام جنسية"، و"آداب الشرب الاجتماعي"—تبين أنها تضم نسبة عالية من منشورات المستخدمين المكتئبين والعديد من علامات الألم العاطفي. أظهر تحليل زمني بسيط أن النشاط في بعض هذه الموضوعات الحساسة ارتفع بسرعة خلال جائحة كوفيد-19، منعكسًا التقارير الأوسع عن تفاقم الصحة النفسية.

من أنماط الإنترنت إلى المساعدة في العالم الحقيقي
لفهم مدى جدية بعض هذه المنشورات، استخدم المؤلفون نموذج لغة منفصلًا لمطابقة المحتوى تقريبيًا مع عناصر من استبيان اكتئاب معروف (مقياس بيك للاكتئاب). أشارت هذه الخطوة الاستكشافية إلى أن موضوعات معينة، خاصة ما يتعلق بصراعات الصحة النفسية، والإيذاء الذاتي، وصورة الجسد، والهوية الجنسانية، غالبًا ما تحتوي على لغة مرتبطة بأعراض اكتئابية متوسطة إلى شديدة. يؤكد المؤلفون أن مثل هذه القراءات الآلية ليست تشخيصات سريرية، لكنها يمكن أن تساعد في لفت الانتباه إلى الأماكن التي تحتاج إلى رعاية خبراء على نحو عاجل.
ماذا يعني هذا للصحة النفسية والتكنولوجيا
بعبارات بسيطة، تُظهر الدراسة أن أكثر نماذج المواضيع تقدمًا اليوم، وخصوصًا BERTopic، قادرة على تحويل محادثات وسائل التواصل الاجتماعي الفوضوية إلى موضوعات واضحة تتوافق مع قلق نفسي حقيقي. كما تُبيّن أن الثقة العمياء في مقاييس الجودة الآلية تنطوي على مخاطر؛ يبقى التدقيق البشري ضروريًا عندما يكون الهدف دعم قرارات تتعلق بالصحة النفسية. في المستقبل، قد تساعد أدوات مماثلة الأطباء والوكالات العامة والباحثين على مراقبة الاتجاهات العامة، والكشف عن المخاطر الناشئة، وتصميم جهود وقائية أفضل—مع ترك الحكم النهائي والرعاية للمحترفين البشريين.
الاستشهاد: Couto, M., Parapar, J. & Losada, D.E. Exploiting topic analysis models to explore psychological dimensions in social media data. Sci Rep 16, 6047 (2026). https://doi.org/10.1038/s41598-026-36339-y
الكلمات المفتاحية: وسائل التواصل الاجتماعي والاكتئاب, نمذجة المواضيع, أنماط الصحة العقلية, إشارات الانتحار الذاتي على الإنترنت, نماذج اللغة في علم النفس