Clear Sky Science · ar
نموذج عاطفي عميق يجمع بين السياق المدفوع بـ ALBERT والهندسة المحسّنة بواسطة EHO
لماذا يهم فهم المشاعر بشكل أذكى
يشارك ملايين الأشخاص يومياً آراء حول منتجات وخدمات وسياسات وأحداث على الإنترنت. تحويل هذا الفيضان من النصوص إلى رؤى موثوقة أمر حيوي للشركات والحكومات والباحثين. ومع ذلك، لغتنا على الإنترنت فوضوية: المزحات الساخرة، العامية، الأخطاء الإملائية، والمشاعر النادرة قد تربك الحواسيب بسهولة. يقدم هذا البحث نظامًا جديدًا لتحليل المشاعر يهدف إلى قراءة هذه المشاعر بدقة أكبر، مع استخدام طاقة حسابية أقل من العديد من نماذج الذكاء الاصطناعي الحالية.
من عد الكلمات البسيط إلى القراءة المعتمدة على السياق
تعاملت أدوات تحليل المشاعر المبكرة مع النص ككيس من الكلمات المنفصلة، بعدّ تكرار كلمات مثل «جيد» أو «فظيع». تجاهل هذا النهج ترتيب الكلمات والسياق الدقيق، مثل عبارة «ليس سيئًا» التي تعني شيئًا أقرب إلى «جيد إلى حد ما». حسّنت أساليب التعلّم العميق ذلك عن طريق معالجة النص كسلاسل، لكنها كانت تتطلب غالبًا مجموعات بيانات موسومة ضخمة وحسابات مكثفة. دفعت نماذج المحوّل مثل BERT الدقة إلى الأمام أكثر، لكن حجمها الكبير يجعل تشغيلها مكلفًا في بيئات العالم الحقيقي مثل منصات خدمة العملاء أو أنظمة مراقبة وسائل التواصل الاجتماعي. يرد مؤلفو هذه الورقة على هذا التحدي بدمج عدة مكونات أخفّ لكنها قوية في نظام موحّد ومبسط.
دماغ أخف لفهم النص
في قلب النموذج يوجد ALBERT، وهو قريب مضغوط من نموذج اللغة BERT. يحول ALBERT كل كلمة في الجملة إلى تمثيل رقمي واعٍ للسياق، يلتقط كيف تتغير المعاني اعتمادًا على الكلمات المجاورة. على عكس النماذج الأكبر، يقلّل ALBERT من استهلاك الذاكرة عن طريق مشاركة المعاملات بين الطبقات وضغط مفردات الكلمات. هذا يجعل تشغيله على أجهزة عادية أسهل دون التضحية بكثير من الفهم. تصبح هذه التمثيلات المستندة إلى ALBERT مدخلاً لتسلسل من الطبقات المتخصصة التي تركز على كيفية تطوّر المشاعر عبر الجملة.
السماح لنوعين من أنظمة الذاكرة بالعمل معًا
لمتابعة كيفية تغير المعنى كلمة بكلمة، يستخدم النظام نوعين من الشبكات العودية: GRU (وحدات التكرار البوابية) وLSTM (وحدات الذاكرة طويلة المدى)، يعمل كل منهما في الاتجاهين الأمامي والخلفي. GRU فعّالة في تتبّع العبارات القصيرة بعدد أقل من المعاملات، بينما تكون LSTM أفضل في تذكّر المعلومات عبر مقاطع أطول من النص. من خلال تكديس طبقة GRU ثنائية الاتجاه فوق طبقة LSTM ثنائية الاتجاه وإضافة آلية انتباه، يمكن للنموذج إبراز الأجزاء الأكثر حملاً بالمشاعر في كل جملة — مثل عبارة «باستثناء عمر البطارية» في مراجعة إيجابية عمومًا. يهدف هذا التصميم الهجين إلى التقاط كلّ من التغيّرات السريعة في النبرة والسياق طويل المدى الذي قد يقلب التقييم العام.

ضبط مستوحى من الطبيعة للحالات الصعبة
بعيدًا عن البنية وحدها، يتناول المؤلفون عقبة رئيسية في العالم الحقيقي: مجموعات بيانات المشاعر غالبًا ما تكون غير متوازنة وصاخبة. المشاعر مثل الاشمئزاز أو الدهشة، والعبارات المحايدة، تظهر أقل تكرارًا من الإيجابية أو السلبية الواضحة، مما يدفع العديد من النماذج إلى تجاهلها. لمواجهة ذلك، تستخدم الورقة تحسين قطيع الأيل (Elk Herd Optimization)، استراتيجية بحث مستوحاة من الطبيعة تحاكي كيفية حركة الأيل وتنافسها وتشكيلها لمجموعات. بعد أن تنتج الشبكة العصبية متجهات داخلية للمشاعر، يقوم خطوة التحسين هذه بضبط كيفية تمثيل هذه المتجهات لكل فئة، خصوصًا النادرة منها، عن طريق تحسين درجة «الملاءمة» بشكل تكراري. تساعد هذه العملية النموذج على تجنّب الحلول السطحية وتحسّن قدرته على التمييز بين المشاعر الدقيقة أو الممثلة بشكل ضعيف.

اختبار النموذج
يقيم المؤلفون نظامهم على ست مجموعات بيانات مستخدمة على نطاق واسع، بما في ذلك منشورات تويتر، ومراجعات المطاعم واللابتوبات، ومجموعة معيارية لمراجعات الأفلام ذات خمس درجات تميّز الآراء الإيجابية جدًا والسلبية جدًا عن الأكثر اعتدالًا. عبر هذه المصادر المتنوّعة، يتفوّق النهج الجديد باستمرار على عدة منافسين متقدّمين قائمين على الرسوم البيانية والمحوّلات من حيث الدقة ومؤشر F1 الذي يوازن بين الضربات الصحيحة والحالات المفقودة. تكون المكاسب قوية بشكل خاص في مهمة مراجعات الأفلام ذات الخمس فئات وعلى الفئات العاطفية الممثلة تمثيلاً ناقصًا، مما يبيّن أن الطريقة تتعامل مع كلّ من العاطفة الدقيقة والبيانات غير المتوازنة. دراسة الإزالة، حيث تُحذف مكونات واحدًا تلو الآخر، تؤكد أن ALBERT، وتصميم GRU–LSTM المدمج، والاهتمام، وتحسين الإيل-المستوحى تساهم كلّها في الأداء العام.
ماذا يعني هذا للتطبيقات اليومية
لغير المتخصّصين، الخلاصة الأساسية هي أن هذا البحث يقدم طريقة أكثر كفاءة وموثوقية لتفسير كميات كبيرة من الآراء على الإنترنت. من خلال مزج نموذج لغة مدمج مع طبقات ذاكرة مكملة وخطوة ضبط مستوحاة حيويًا، يقرأ النظام ما بين السطور بدقة أكبر، خصوصًا عندما تكون المشاعر دقيقة أو البيانات منحازة. هذا يجعله واعدًا للاستخدامات العملية مثل تتبّع رضى العملاء، مراقبة مواقف الصحة العامة، أو قياس ردود الفعل على السياسات والأحداث، حيث تهمّ كلّ من الدقّة وتكلفة الحوسبة.
الاستشهاد: Oqaibi, H., Sharma, S. A deep sentiment model combining ALBERT-driven context and EHO-optimized architecture. Sci Rep 16, 5784 (2026). https://doi.org/10.1038/s41598-026-36389-2
الكلمات المفتاحية: تحليل المشاعر, ALBERT, التعلّم العميق, تصنيف النص, تحسين ميتاهيرستيك