Clear Sky Science · pl

Ocena modeli sztucznej inteligencji do klasyfikacji reklam żywności i alkoholu w porównaniu z ocenami ludzkimi

· Powrót do spisu

Dlaczego ważne jest śledzenie reklam online

Każdego dnia ludzie przewijają niezliczone reklamy żywności i alkoholu w mediach społecznościowych, często nie zwracając uwagi, jak mocno te przekazy mogą kształtować to, co jemy i pijemy. Agencje zdrowia i badacze chcą kontrolować, jak intensywnie promowane są niezdrowe produkty, zwłaszcza wobec dzieci i nastolatków, ale ręczne sprawdzanie tysięcy reklam jest powolne i kosztowne. To badanie stawia aktualne pytanie: czy nowoczesne systemy sztucznej inteligencji mogą wykonywać tę pracę monitorującą tak niezawodnie jak ludzie, a jeśli tak, to którym rodzajom cech reklam już można ufać?

Jak badanie obejmowało reklamy z prawdziwego świata

Badacze zgromadzili 1000 reklam z Facebooka od 77 dużych belgijskich marek żywności, napojów i alkoholu, włącznie z obrazami i podpisami. Około 600 osób z ogółu społeczeństwa, trzech przeszkolonych dietetyków oraz cztery zaawansowane systemy AI obejrzeli te same reklamy. Dla każdej reklamy odpowiadali na pytania, takie jak czy występuje alkohol, do kogo reklama zdawała się być skierowana (dzieci, nastolatki czy dorośli), jaki był typ reklamodawcy oraz które taktyki sprzedażowe lub kategorie żywności się pojawiały. Niektóre pytania miały tylko jedną możliwą odpowiedź, jak decyzja tak–nie dotycząca alkoholu. Inne dopuściły wiele odpowiedzi, na przykład różne sztuczki marketingowe lub kilka typów żywności w tej samej reklamie. Taki schemat pozwolił zespołowi porównać AI, pracowników społecznościowych i ekspertów bezpośrednio ze sobą.

Figure 1
Figure 1.

Gdzie AI dorównuje osądowi ludzkiemu

W przypadku prostych pytań z jedną odpowiedzią systemy AI — szczególnie GPT-4o i Qwen — radziły sobie niezwykle dobrze. Przy ustalaniu, czy reklama zawierała alkohol, zgodność tych modeli z dietetykami wynosiła ponad 90 procent i była niemal nieodróżnialna od zgodności między samymi dietetykami. Przy klasyfikacji, do kogo reklama była głównie skierowana i jakiego typu był reklamodawca, AI ponownie osiągały poziomy zgodności mieszczące się w naturalnej wariancji obserwowanej między różnymi ludzkimi koderami. Innymi słowy, dla jednoznacznych cech, takich jak „alkohol czy nie” oraz prostych kategorii odbiorców czy rodzaju marki, najlepsze systemy AI już działają na poziomie zbliżonym do ludzkiego.

Gdzie robi się skomplikowanie i pojawiają się rozbieżności

Wydajność spadała przy bardziej złożonych pytaniach dopuszczających wiele odpowiedzi. Gdy koderzy musieli zidentyfikować kilka możliwych ofert promocyjnych (zniżki, konkursy, programy lojalnościowe), strategie marketingowe (wydarzenia, postacie, rekomendacje) lub szczegółowe kategorie żywności (jak przekąski, dania gotowe czy nabiał), zgodność była wyraźnie niższa dla wszystkich — zarówno ludzi, jak i AI. Nawet dietetycy, będący specjalistami od żywienia, często się między sobą nie zgadzali, szczególnie w przypadku abstrakcyjnych taktyk marketingowych. Dla niektórych etykiet strategii marketingowych zgodność parami między dietetykami mogła być bardzo niska, co pokazuje, że samo zadanie jest trudne i w pewnym stopniu subiektywne. W tym kontekście AI nie odstawała wyraźnie od ludzi; raczej zachowywała się jak dodatkowy, stosunkowo „głośny” ludzki oceniajacy.

Figure 2
Figure 2.

Ukryte uprzedzenia w tym, jak AI widzi reklamy

Patrząc poza ogólne wyniki, autorzy sprawdzili, które etykiety modele systematycznie nadmiernie wykrywają lub niedostatecznie oznaczają. We wszystkich pytaniach AI były niechętne wybieraniu opcji oznaczających „brak” lub „nie dotyczy”, częściej przypisując przynajmniej jedną konkretną cechę. To stwarza ryzyko zawyżenia częstości występowania ofert specjalnych lub taktyk perswazyjnych. Niektóre modele, takie jak Gemma i Qwen, wykazywały silniejsze uprzedzenia niż inne: na przykład częściej oznaczały wydarzenia i dania gotowe, nawet gdy ludzie tego nie wskazywali. GPT-4o wykazywał na ogół łagodniejsze, bardziej konserwatywne wzorce, ale i on miał swoje ślepe punkty — na przykład przy ofertach zniżkowych oraz rekomendacjach celebrytów czy działaniach charytatywnych. Te systematyczne specyfiki oznaczają, że poleganie na jednym systemie AI może zniekształcać szacunki dotyczące ekspozycji ludzi na konkretne taktyki marketingowe lub typy żywności.

Wytyczne dotyczące stosowania AI w praktyce

Aby przełożyć wyniki na praktykę, autorzy proponują strategię trzypoziomową. Na pierwszym poziomie relatywnie proste zadania z jedną odpowiedzią — takie jak wykrywanie alkoholu, podstawowy typ reklamy czy główna grupa docelowa — nadają się do automatyzacji na dużą skalę, przy czym AI może przejąć znaczną część pracy ręcznej po niewielkiej lokalnej weryfikacji. Drugi poziom obejmuje bardziej złożone pytania z wieloma odpowiedziami dotyczące ofert, strategii i szczegółowych kategorii żywności. Tutaj AI może być pomocnym asystentem do wstępnego przeglądu reklam, sugerowania etykiet lub wspierania recenzentów ludzkich, ale nadzór człowieka i lepsze definicje etykiet pozostają kluczowe. Trzeci poziom obejmuje jeszcze bardziej zawiłe lub nieprzetestowane obszary, takie jak inne szkodliwe substancje czy drobiazgowe szczegóły żywieniowe, gdzie wyniki AI powinny być obecnie traktowane jako eksploracyjne, a nie wiarygodne.

Co to oznacza dla konsumentów i polityki

Mówiąc prościej, badanie pokazuje, że dzisiejsza AI może już pomagać agencjom zdrowia publicznego i badaczom w monitorowaniu prostych aspektów reklam żywności i alkoholu na skalę współczesnych mediów społecznościowych. Jednak jeśli chodzi o subtelne sztuczki sprzedażowe i złożone kategorie żywności, zarówno ludzie, jak i maszyny wciąż mają trudności z osiągnięciem porozumienia, a modele AI mają rozpoznawalne uprzedzenia. Autorzy konkludują, że staranne łączenie AI z wiedzą ludzką — używanie AI tam, gdzie jest najsilniejsza, oraz ludzi tam, gdzie liczy się niuans i interpretacja — oferuje najbardziej obiecującą drogę do sprawiedliwego i skutecznego monitorowania promowania niezdrowych produktów online.

Cytowanie: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x

Słowa kluczowe: reklama żywności, marketing alkoholu, sztuczna inteligencja, media społecznościowe, polityka zdrowia publicznego