Clear Sky Science · he
הערכת מודלים של בינה מלאכותית למיון פרסומות מזון ואלכוהול מול רמות אנושיות
מדוע חשוב לעקוב אחר פרסומות מקוונות
כל יום אנשים גוללים מעבר לאין־ספור פרסומות למזון ואלכוהול ברשתות החברתיות, לעתים בלי לשים לב עד כמה המסרים האלה משפיעים על מה שאנו אוכלים ושותים. רשויות בריאות וחוקרים מעוניינים לעקוב אחרי היקף הקידום של מוצרים לא בריאים, במיוחד בקרב ילדים ובני נוער, אך בדיקה ידנית של אלפי פרסומות איטית ויקרה. המחקר הזה שואל שאלה מעת לעת: האם מערכות בינה מלאכותית מודרניות יכולות לבצע את העבודה הזו באמינות דומה לזו של בני אדם, ואם כן — אילו סוגי תכונות של פרסומות כבר ניתן לבטוח להן?
כיצד המחקר בחן פרסומות מהעולם האמיתי
החוקרים אספו 1,000 מודעות מפייסבוק מ-77 מותגים בולטים מבלגיה בתחום המזון, המשקאות והאלכוהול, כולל התמונות והכיתובים. כ-600 משתתפים מהציבור הרחב, שלוש דיאטניות מאומנות וארבע מערכות בינה מלאכותית מתקדמות צפו באותן פרסומות. עבור כל פרסומת הם השיבו על שאלות כמו האם יש אלכוהול בתמונה, למי הפרסומת נראית מכוונת (ילדים, מתבגרים או מבוגרים), איזה סוג מפרסם מדובר, ואילו תמריצי מכירה או קטגוריות מזון מופיעות. חלק מהשאלות היו חד־תשובתיות, כגון החלטת כן־לא לגבי אלכוהול. אחרות אפשרו מספר תשובות, לדוגמה כמה מבצעי פרמיה שונים או מספר סוגי מזון באותה פרסומת. עיצוב זה אפשר לצוות להשוות בין הבינה המלאכותית, עובדי קהל ומומחים ישירות אחד מול השני.

איפה הבינה המלאכותית מתיישבת עם שיפוט אנושי
בשאלות פשוטות בעלות תשובה יחידה הופיעו המערכות—ובפרט GPT-4o ו-Qwen—ביצועים מרשימים. בקביעת האם פרסומת מכילה אלכוהול, ההסכמה בין המודלים הללו לבין הדיאטניות עמדה על יותר מ-90 אחוז וכמעט שלא נבדלה מההסכמה בין הדיאטניות עצמן. בסיווג למי הפרסומת מיועדת ובאיזה סוג מפרסם מדובר, הגיעו ה-AI שוב לרמות הסכמה שנמצאות בטווח השונה הטבעי בין מקודדים אנושיים. במילים אחרות, עבור תכונות חד־משמעיות כמו "אלכוהול או לא" וקהל או סוג מותג ברורים, מערכות ה-AI הטובות כבר פועלות ברמת ביצוע דומה לזו האנושית.
איפה הדברים מסתבכים ויש חוסר הסכמה
הביצועים ירדו בשאלות מורכבות יותר המאפשרות מספר תשובות. כאשר מקודדים נדרשו לזהות מספר הצעות פרימיה אפשריות (הנחות, תחרויות, תוכניות נאמנות), אסטרטגיות שיווק (אירועים, דמויות, חסויות) או קטגוריות מזון מפורטות (חטיפים, מנות מוכנות, מוצרי חלב), ההסכמה היתה נמוכה באופן בולט עבור כולם—בני אדם וה-AI כאחד. גם הדיאטניות, שמתמחות בתזונה, לעתים רבים לא הסכימו זו עם זו, במיוחד לגבי טקטיקות שיווק מופשטות. עבור תוויות אסטרטגיית שיווק מסוימות ההסכמה הזוגית בין הדיאטניות יכולה להיות נמוכה מאוד, מה שמראה שהמשימה קשה ובעלת מרכיב סובייקטיבי. בהקשר זה, ה-AI לא נותר בבירור מאחור מהאנשים; במקום זאת היא התנהגה כמו מקודד אנושי נוסף, די רועש באמינותו.

הטיות נסתרות באופן שבו ה-AI רואה פרסומות
מעבר לציונים הכלליים, החוקרים בחנו אילו תוויות המודלים נוטים לעקוב אחרי־יותר או לעקוף באופן עקבי. בכל השאלות, כל מערכות ה-AI היססו לבחור אפשרויות שמשמעותן "אין" או "לא רלוונטי", והעדיפו במידה רבה לשייך לפחות תכונה מוחשית אחת. זה יוצר סיכון להערכת יתר של תדירות הופעת מבצעים או טקטיקות שכנוע. חלק מהמ '..odelים, כגון Gemma ו-Qwen, הציגו הטיות חזקות יותר מאחרים: לדוגמה, הם סימנו לעתים קרובות אירועים ומנות מוכנות אפילו כשהמקודדים האנושיים לא עשו זאת. GPT-4o הציג בדרך כלל התנהגות מתונה ושמרנית יותר, אך עדיין היו לו נקודות עיוורון—לדוגמה לגבי הצעות הנחה וחסויות של סלבריטאים או עמותות. הדברים המערכתיים הללו משמעותם כי הסתמכות על מערכת AI יחידה עלולה לעוות את האומדן של כמה אנשים נחשפים לטקטיקות שיווק או לסוגי מזון מסוימים.
הנחיות לשימוש בבינה מלאכותית בשטח
כדי לתרגם את התוצאות לפרקטיקה, המחברים מציעים אסטרטגיה בשלוש שכבות. בשכבה הראשונה, משימות פשוטות יחסית עם תשובה אחת—כגון גילוי אלכוהול, סוג פרסומת בסיסי או קבוצת היעד העיקרית—מוכנות לאוטומציה בקנה מידה גדול, כאשר ה-AI יכול להחליף חלק ניכר מהעבודה הידנית לאחר בדיקת אימות מקומית קצרה. השכבה השנייה כוללת שאלות מורכבות יותר, רב־תשובתיות, על מבצעים, אסטרטגיות וקטגוריות מזון מפורטות. כאן ה-AI יכול לשמש כמסייע יעיל לסינון מקדים של פרסומות, להציע תוויות או להנחות בודקים אנושיים, אך פיקוח אנושי והגדרות תוויות טובות יותר נשארים קריטיים. השכבה השלישית כוללת תחומים מסובכים או לא נבדקו עדיין, כמו חומרים מזיקים אחרים או פרטי תזונה דקים, שבהם יש לראות את פלטי ה-AI כיום כחוקרים ולא כאמינים.
מה המשמעות עבור צרכנים ומדיניות
במונחים פשוטים, המחקר מראה שה-AI של היום כבר יכולה לסייע לרשויות בריאות וחוקרים לעקוב אחרי היבטים ברורים של פרסום מזון ואלכוהול בקנה מידה של רשתות חברתיות מודרניות. עם זאת, בכל הנוגע לטריקים שיווקיים עדינים ולקטגוריות מזון מורכבות, גם בני אדם וגם מכונות עדיין מתקשים להגיע להסכמה, ודגמי ה-AI נושאים הטיות שניתן לזהות. המחברים מסכמים כי שילוב זהיר של בינה מלאכותית ומומחיות אנושית—להשתמש ב-AI במקום שהיא חזקה, ובבני אדם במקום שנדרשים ניואנסים ופרשנות—מהווה את הדרך המבטיחה ביותר לניטור הוגן ויעיל של אופן קידום המוצרים הלא בריאים ברשת.
ציטוט: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x
מילות מפתח: פרסום מזון, שיווק אלכוהול, בינה מלאכותית, רשתות חברתיות, מדיניות בריאות הציבור