Clear Sky Science · fr

Évaluer les modèles d’IA pour la classification des publicités alimentaires et alcoolisées par rapport aux références humaines

2026-03-11 · Retour à l’index

Pourquoi il est important de suivre les publicités en ligne

Tous les jours, les utilisateurs défilent des dizaines d’annonces pour des aliments et des boissons alcoolisées sur les réseaux sociaux, souvent sans réaliser à quel point ces messages peuvent influencer ce que nous mangeons et buvons. Les agences de santé et les chercheurs souhaitent surveiller l’intensité de la promotion des produits nocifs, en particulier auprès des enfants et des adolescents, mais vérifier manuellement des milliers d’annonces est lent et coûteux. Cette étude pose une question d’actualité : les systèmes modernes d’intelligence artificielle peuvent-ils effectuer ce travail de surveillance aussi fiablement que des humains, et si oui, pour quels types de caractéristiques publicitaires peut-on déjà leur faire confiance ?

Comment l’étude a examiné des publicités du monde réel

Les chercheurs ont rassemblé 1000 publicités Facebook provenant de 77 grandes marques belges d’alimentation, de boissons et d’alcool, incluant les images et leurs légendes. Environ 600 membres du grand public, trois diététicien·ne·s formé·e·s et quatre systèmes d’IA avancés ont tous évalué les mêmes annonces. Pour chaque annonce, ils ont répondu à des questions telles que la présence d’alcool, le public visé apparent (enfants, adolescents ou adultes), le type d’annonceur et les tactiques promotionnelles ou catégories d’aliments présentes. Certaines questions n’admettaient qu’une seule réponse possible, comme une décision oui/non sur la présence d’alcool. D’autres autorisaient des réponses multiples, par exemple plusieurs astuces marketing ou plusieurs types d’aliments dans une même annonce. Ce dispositif a permis à l’équipe de comparer directement IA, crowdworkers et expert·e·s.

Où l’IA rejoint le jugement humain

Pour les questions simples à réponse unique, les systèmes d’IA—en particulier GPT-4o et Qwen—ont obtenu des performances remarquables. Lorsqu’il s’agissait de décider si une annonce contenait de l’alcool, l’accord entre ces modèles et les diététicien·ne·s dépassait 90 % et était presque indiscernable de l’accord observé entre les diététicien·ne·s eux/elles-mêmes. Pour classer le public principal visé et le type d’annonceur, les IA ont de nouveau atteint des niveaux d’accord situés dans la variation naturelle observée entre différents codeurs humains. Autrement dit, pour des caractéristiques nettes comme « alcool ou pas » et des catégories d’audience ou de marque simples, les meilleurs systèmes d’IA opèrent déjà à peu près au niveau humain.

Où la situation devient plus confuse et sujette à désaccord

Les performances chutent pour les questions plus complexes à réponses multiples. Lorsque les codeurs devaient identifier plusieurs offres possibles (réductions, concours, programmes de fidélité), des stratégies marketing (événements, personnages, endorsements) ou des catégories alimentaires détaillées (comme snacks, plats préparés ou produits laitiers), l’accord était sensiblement plus faible pour tout le monde—humains comme IA. Même les diététicien·ne·s, spécialistes de la nutrition, étaient souvent en désaccord entre eux/elles, surtout sur des tactiques marketing abstraites. Pour certaines étiquettes de stratégie marketing, l’accord par paires entre diététicien·ne·s pouvait être extrêmement bas, montrant que la tâche elle‑même est difficile et quelque peu subjective. Dans ce contexte, l’IA ne se plaçait pas clairement en retard par rapport aux humains ; elle se comportait plutôt comme un évaluateur humain supplémentaire, relativement bruyant.

Biais cachés dans la perception des annonces par l’IA

Au‑delà des scores globaux, les auteurs ont examiné comment les modèles sur‑ ou sous‑détectaient systématiquement certaines étiquettes. Toutes les IA ont eu tendance à éviter les options signifiant « aucune » ou « non applicable », préférant assigner au moins une caractéristique concrète. Cela crée un risque de surestimer la fréquence des offres spéciales ou des tactiques persuasives. Certains modèles, comme Gemma et Qwen, ont montré des biais plus prononcés que d’autres : par exemple, ils signalaient souvent des événements et des plats préparés même lorsque les codeurs humains ne le faisaient pas. GPT-4o présentait généralement des schémas plus modérés et conservateurs, mais gardait des angles morts—par exemple sur les offres de réduction ou les endorsements par des célébrités ou des associations caritatives. Ces particularités systématiques signifient que s’appuyer sur un seul système d’IA pourrait fausser les estimations de l’exposition du public à certaines tactiques marketing ou catégories d’aliments.

Directives pour l’utilisation de l’IA en pratique

Pour traduire leurs résultats en pratique, les auteurs proposent une stratégie en trois niveaux. Au premier niveau, les tâches relativement simples à réponse unique—comme détecter la présence d’alcool, le type d’annonce basique ou le groupe cible principal—sont prêtes pour une automatisation à grande échelle, l’IA pouvant prendre en charge une grande partie du travail manuel après une petite vérification locale. Le deuxième niveau couvre les questions plus complexes à réponses multiples concernant les offres, les stratégies et les catégories alimentaires détaillées. Ici, l’IA peut être un assistant utile pour présélectionner les annonces, suggérer des étiquettes ou guider les réviseurs humains, mais la supervision humaine et de meilleures définitions d’étiquettes restent cruciales. Un troisième niveau inclut des domaines encore plus complexes ou non testés, comme d’autres substances nocives ou des détails nutritionnels fins, où les sorties de l’IA devraient actuellement être considérées comme exploratoires plutôt que fiables.

Ce que cela signifie pour les consommateurs et les décideurs

En termes simples, l’étude montre que l’IA d’aujourd’hui peut déjà aider les agences de santé publique et les chercheurs à surveiller les aspects simples de la publicité alimentaire et alcoolisée à l’échelle des réseaux sociaux modernes. Cependant, pour ce qui est des astuces de vente subtiles et des catégories alimentaires complexes, humains et machines peinent encore à s’entendre, et les modèles d’IA présentent des biais reconnaissables. Les auteurs concluent qu’une combinaison soigneuse de l’IA et de l’expertise humaine—utiliser l’IA là où elle est la plus performante, et les humains là où la nuance et l’interprétation comptent—constitue la voie la plus prometteuse pour une surveillance juste et efficace de la promotion en ligne des produits malsains.

Citation: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x

Mots-clés: publicité alimentaire, marketing de l’alcool, intelligence artificielle, réseaux sociaux, politique de santé publique