Clear Sky Science · ar

تقييم نماذج الذكاء الاصطناعي لتصنيف إعلانات الطعام والكحول مقابل المعايير البشرية

2026-03-11 · العودة إلى الفهرس

لماذا يهم تتبّع الإعلانات على الإنترنت

يومياً، يمرّ الناس عبر عدد هائل من إعلانات الطعام والكحول على وسائل التواصل الاجتماعي، غالباً دون أن يلاحظوا مدى تأثير هذه الرسائل في ما نأكل ونشرب. تسعى الوكالات الصحية والباحثون إلى مراقبة مدى ترويج المنتجات غير الصحية، لا سيما للأطفال والمراهقين، لكن فحص آلاف الإعلانات يدوياً بطيء ومكلف. تطرح هذه الدراسة سؤالاً معاصراً: هل يمكن لأنظمة الذكاء الاصطناعي الحديثة أداء هذا العمل المراقبي بنفس موثوقية البشر، وإذا كان الجواب نعم، فما أنواع خصائص الإعلانات التي يمكننا الوثوق فيها بالفعل؟

كيف درست الدراسة إعلانات العالم الحقيقي

جمع الباحثون 1000 إعلان من فيسبوك لِـ77 علامة تجارية بلجيكية كبيرة للأغذية والمشروبات والكحول، شاملة الصور والنصوص المصاحبة لها. قيّم نحو 600 من عامة الجمهور، وثلاثة أخصائيي تغذية مدرّبين، وأربعة أنظمة ذكاء اصطناعي متقدمة نفس الإعلانات. لكل إعلان، أجابوا عن أسئلة مثل ما إذا كان الإعلان يحتوي على كحول، من الذي يبدو أن الإعلان موجَّه إليه (أطفال، مراهقون، أو بالغون)، وما نوع المعلن، وأي تكتيكات بيع أو فئات طعام ظهرت. بعض الأسئلة كانت بإجابة واحدة فقط، مثل قرار نعم–لا بشأن وجود الكحول. وأسئلة أخرى سمحت بإجابات متعددة، مثل عدة عروض ترويجية أو عدة أنواع طعام في نفس الإعلان. سمح هذا التصميم للمجموعة بمقارنة أداء الذكاء الاصطناعي، والعاملين الأعموميين، والخبراء وجهاً لوجه.

حيث يوازي الذكاء الاصطناعي الحكم البشري

بالنسبة للأسئلة البسيطة ذات الإجابة الواحدة، أدت أنظمة الذكاء الاصطناعي — وبخاصة GPT-4o وQwen — أداءً ملحوظاً. عند تقرير ما إذا كان الإعلان يحتوي على كحول، بلغ التوافق بين هذه النماذج وأخصائيي التغذية أكثر من 90 بالمئة وكان لا يكاد يختلف عن التوافق بين أخصائيي التغذية أنفسهم. عند تصنيف من هو الجمهور المستهدف بشكل أساسي ونوع المعلن، حققت الأنظمة أيضاً مستويات توافق تقع ضمن التباين الطبيعي بين المرمّمين البشريين المختلفين. بمعنى آخر، بالنسبة إلى الخصائص الواضحة مثل «هل يوجد كحول أم لا» والجماهير أو نوع العلامة التجارية البسيطة، تعمل أفضل أنظمة الذكاء الاصطناعي حالياً بمستوى مقارب للمستوى البشري.

أين تصبح الأمور فوضوية ومثيرة للاختلاف

انخفض الأداء في الأسئلة الأكثر تعقيداً والتي تسمح بإجابات متعددة. عندما طُلب من المقوّمين تحديد عدة عروض محتملة (خصومات، مسابقات، برامج ولاء)، أو استراتيجيات تسويقية (فعاليات، شخصيات، تأييدات)، أو فئات طعام مفصلة (مثل الوجبات الخفيفة، الوجبات الجاهزة، أو الألبان)، كان التوافق أقل بكثير لدى الجميع — البشر والآلات على حد سواء. حتى أخصائيو التغذية، وهم متخصصون في التغذية، اختلفوا كثيراً فيما بينهم، لا سيّما بشأن التكتيكات التسويقية المجردة. لبعض تسميات استراتيجيات التسويق، كان التوافق الزوجي بين أخصائيي التغذية منخفضاً للغاية، مما يُظهِر أن المهمة بحد ذاتها صعبة وذاتية إلى حد ما. في هذا السياق، لم يتخلف الذكاء الاصطناعي بوضوح عن البشر؛ بدلاً من ذلك تصرف كقاضي بشري إضافي لكنه مع بعض الضوضاء.

التحيّزات الخفيّة في رؤية الذكاء الاصطناعي للإعلانات

بعيداً عن الدرجات الإجمالية، فحص المؤلفون كيف تميل النماذج باستمرار إلى الإفراط أو التقليل في اكتشاف تسميات محددة. عبر الأسئلة، كانت جميع أنظمة الذكاء الاصطناعي مترددة في اختيار خيارات تعني «لا شيء» أو «غير قابل للتطبيق»، وتميل بدلاً من ذلك إلى إسناد سمة ملموسة واحدة على الأقل. هذا يخلق خطر المبالغة في تقدير مدى تكرار العروض الخاصة أو التكتيكات الإقناعية. أظهرت بعض النماذج، مثل Gemma وQwen، تحيّزات أقوى من غيرها: على سبيل المثال، كانت غالباً ما تشير إلى فعاليات ووجبات جاهزة حتى عندما لم يفعل المقوّمون البشريون ذلك. أظهر GPT-4o نمطاً أكثر اعتدالاً وتحمّلاً، لكنه ظل لديه نقاط عمياء — على سبيل المثال عروض الخصم وتأثيرات المشاهير أو تأييد المؤسسات الخيرية. تعني هذه الشوائب المنهجية أن الاعتماد على نظام ذكاء اصطناعي واحد قد يحرّف تقديرات مدى تعرض الناس لتكتيكات تسويق أو فئات طعام معينة.

إرشادات لاستخدام الذكاء الاصطناعي في الواقع

لترجمة نتائجهم إلى ممارسة عملية، يقترح المؤلفون استراتيجية من ثلاث طبقات. في الطبقة الأولى، المهام البسيطة نسبياً ذات الإجابة الواحدة — مثل اكتشاف الكحول، نوع الإعلان الأساسي، أو المجموعة المستهدفة الرئيسية — جاهزة للأتمتة على نطاق واسع، مع تولي الذكاء الاصطناعي الكثير من العمل اليدوي بعد فحص تحقق محلي بسيط. تغطي الطبقة الثانية الأسئلة الأكثر تعقيداً والمتعددة الإجابات حول العروض والاستراتيجيات وفئات الطعام المفصّلة. هنا يمكن للذكاء الاصطناعي أن يكون مساعداً مفيداً لفرز الإعلانات أولياً، واقتراح تسميات، أو توجيه المراجعين البشريين، لكن يظل الإشراف البشري وتعريفات واضحة للتسميات أموراً حاسمة. تشمل الطبقة الثالثة مجالات أكثر تعقيداً أو غير مختبرة بعد، مثل مواد ضارة أخرى أو تفاصيل تغذوية دقيقة، حيث ينبغي حالياً اعتبار مخرجات الذكاء الاصطناعي استكشافية بدلاً من موثوقة.

ماذا يعني هذا للمستهلكين والسياسات

بعبارة بسيطة، تُظهر الدراسة أن الذكاء الاصطناعي الحالي يمكنه بالفعل مساعدة وكالات الصحة العامة والباحثين في مراقبة الجوانب الواضحة من إعلانات الطعام والكحول على نطاق وسائل التواصل الاجتماعي الحديثة. ومع ذلك، عندما يتعلق الأمر بالحيل البيعية الدقيقة وفئات الطعام المعقّدة، لا يزال البشر والآلات يعانون من صعوبات في الوصول إلى اتفاق، وتحمل نماذج الذكاء الاصطناعي تحيّزات يمكن التعرف عليها. يستنتج المؤلفون أن الجمع الحذر بين الذكاء الاصطناعي والخبرة البشرية — استخدام الذكاء الاصطناعي حيث يكون أقوى، والبشر حيث تستلزم الأمور دقة وتفسيراً — يقدم المسار الأكثر وعداً نحو مراقبة عادلة وفعّالة لكيفية ترويج المنتجات غير الصحية على الإنترنت.

الاستشهاد: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x

الكلمات المفتاحية: إعلانات الطعام, تسويق الكحول, الذكاء الاصطناعي, وسائل التواصل الاجتماعي, سياسة الصحة العامة