Clear Sky Science · sv

Utvärdering av AI-modeller för klassificering av mat- och alkoholannonser mot mänskliga referenser

2026-03-11 · Tillbaka till index

Varför det är viktigt att följa onlineannonser

Varje dag bläddrar människor förbi otaliga annonser för mat och alkohol på sociala medier, ofta utan att märka hur starkt dessa budskap kan påverka vad vi äter och dricker. Myndigheter och forskare vill hålla koll på hur intensivt ohälsosamma produkter marknadsförs, särskilt mot barn och tonåringar, men att manuellt granska tusentals annonser är långsamt och kostsamt. Denna studie ställer en aktuell fråga: kan moderna system för artificiell intelligens utföra detta övervakningsarbete lika pålitligt som människor, och i så fall för vilka typer av annonsfunktioner kan vi redan lita på dem?

Hur studien undersökte verkliga annonser

Forskarna samlade 1000 Facebook-annonser från 77 stora belgiska mat-, dryckes- och alkoholvarumärken, inklusive både bilder och deras bildtexter. Omkring 600 personer från allmänheten, tre utbildade dietister och fyra avancerade AI-system granskade samma annonser. För varje annons besvarade de frågor som om alkohol fanns med, vem annonsen verkade rikta sig till (barn, tonåringar eller vuxna), vilken typ av avsändare det var och vilka försäljningsknep eller matkategorier som förekom. Vissa frågor hade bara ett möjligt svar, till exempel ett ja–nej-beslut om alkohol. Andra tillät flera svar, som flera olika marknadsföringstrick eller flera matt typer i samma annons. Denna design gjorde det möjligt för teamet att jämföra AI, folkmassor och experter direkt mot varandra.

När AI matchar mänskligt omdöme

För enkla frågor med ett enda svar presterade AI-systemen—särskilt GPT-4o och Qwen—anmärkningsvärt bra. När det gällde att avgöra om en annons innehöll alkohol var överensstämmelsen mellan dessa modeller och dietisterna över 90 procent och nästan omöjlig att särskilja från överensstämmelsen mellan dietisterna själva. Vid klassificering av vem annonsen främst riktade sig till och vilken typ av annonsör det var nådde AI:erna återigen överensstämmelsenivåer som låg inom den naturliga variationen som ses mellan olika mänskliga kodare. Med andra ord, för tydliga egenskaper som "alkohol eller inte" och enkla målgrupps- eller varumärkestyper fungerar de bästa AI-systemen redan ungefär på mänsklig nivå.

Var det blir rörigt och oenigt

Prestandan sjönk för mer komplicerade frågor med flera svar. När kodarna behövde identifiera flera möjliga erbjudanden (rabatter, tävlingar, lojalitetsprogram), marknadsföringsstrategier (evenemang, karaktärer, rekommendationer) eller detaljerade matkategorier (som snacks, färdigrätter eller mejeriprodukter) var överensstämmelsen märkbart lägre för alla—både människor och AI. Även dietisterna, som är näringsspecialister, var ofta oense med varandra, särskilt kring abstrakta marknadsföringstaktiker. För vissa marknadsföringsstrategi-etiketter kunde parvis överensstämmelse mellan dietisterna vara mycket låg, vilket visar att uppgiften i sig är svår och till viss del subjektiv. I detta sammanhang föll inte AI tydligt efter människorna; istället uppträdde det mycket som en ytterligare, något brusig mänsklig bedömare.

Dolda snedvridningar i hur AI ser annonser

Utöver de övergripande poängen undersökte författarna hur modellerna konsekvent över- eller underdetekterade specifika etiketter. Över olika frågor var alla AI:er motvilliga att välja alternativ som betydde "ingen" eller "inte tillämpligt", och tenderade istället att tilldela åtminstone en konkret egenskap. Detta skapar en risk för att man överskattar hur ofta specialerbjudanden eller övertygande taktiker förekommer. Vissa modeller, såsom Gemma och Qwen, visade starkare bias än andra: till exempel flaggade de ofta evenemang och färdigrätter även när mänskliga kodare inte gjorde det. GPT-4o visade generellt mildare, mer konservativa mönster, men hade ändå blinda fläckar—till exempel vid rabatt-erbjudanden och kändis- eller välgörenhetsrekommendationer. Dessa systematiska egenheter innebär att beroende av ett enda AI-system kan snedvrida uppskattningar av hur mycket människor exponeras för särskilda marknadsföringstaktiker eller matt typer.

Riktlinjer för att använda AI i praktiken

För att omsätta sina resultat i praktik föreslår författarna en trestegsstrategi. I det första steget är relativt enkla uppgifter med ett svar—såsom att upptäcka alkohol, grundläggande annonstyp eller huvudmålgrupp—redo för storskalig automatisering, där AI kan ta över mycket av det manuella arbetet efter en liten lokal valideringskontroll. Det andra steget täcker mer komplexa, flersvarsfrågor om erbjudanden, strategier och detaljerade matkategorier. Här kan AI vara en hjälpsam assistent för att förgranska annonser, föreslå etiketter eller vägleda mänskliga granskare, men mänsklig tillsyn och bättre etikettdefinitioner förblir avgörande. Ett tredje steg inkluderar ännu mer intrikata eller outredda områden, såsom andra skadliga substanser eller finfördelade näringsdetaljer, där AI-resultat för närvarande bör behandlas som explorativa snarare än pålitliga.

Vad detta betyder för konsumenter och policy

Enkelt uttryckt visar studien att dagens AI redan kan hjälpa folkhälsomyndigheter och forskare att övervaka enkla aspekter av mat- och alkoholreklam i skala med moderna sociala medier. Men när det gäller subtila säljtekniker och komplexa matkategorier har både människor och maskiner fortfarande svårt att nå enighet, och AI-modeller bär igenkännbara bias. Författarna drar slutsatsen att en noggrann kombination av AI och mänsklig expertis—att använda AI där den är starkast och människor där nyans och tolkning spelar störst roll—erbjuder den mest lovande vägen mot rättvis och effektiv övervakning av hur ohälsosamma produkter marknadsförs online.

Citering: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x

Nyckelord: matreklam, alkoholmarknadsföring, artificiell intelligens, sociala medier, folkhälsopolitik