Clear Sky Science · pt
Avaliação de modelos de IA para classificação de anúncios de alimentos e álcool em comparação com padrões humanos
Por que monitorar anúncios online é importante
Todo dia, as pessoas passam por inúmeros anúncios de alimentos e bebidas alcoólicas nas redes sociais, muitas vezes sem perceber o quanto essas mensagens podem influenciar o que comemos e bebemos. Agências de saúde e pesquisadores querem monitorar com que intensidade produtos pouco saudáveis são promovidos, especialmente para crianças e adolescentes, mas verificar manualmente milhares de anúncios é lento e caro. Este estudo faz uma pergunta atual: sistemas modernos de inteligência artificial podem realizar esse trabalho de monitoramento com a mesma confiabilidade que pessoas, e, em caso afirmativo, para quais tipos de características dos anúncios já podemos confiar neles?
Como o estudo analisou anúncios do mundo real
Os pesquisadores reuniram 1000 anúncios do Facebook de 77 grandes marcas belgas de alimentos, bebidas e álcool, incluindo tanto as imagens quanto suas legendas. Cerca de 600 membros do público em geral, três nutricionistas treinadas e quatro sistemas avançados de IA analisaram os mesmos anúncios. Para cada anúncio, responderam perguntas como se havia presença de álcool, a quem o anúncio parecia se dirigir (crianças, adolescentes ou adultos), que tipo de anunciante era e quais táticas de venda ou categorias de alimentos apareciam. Algumas perguntas tinham apenas uma resposta possível, como uma decisão sim–não sobre álcool. Outras permitiam múltiplas respostas, como diferentes truques de marketing ou vários tipos de alimento no mesmo anúncio. Esse desenho permitiu à equipe comparar IA, trabalhadores da multidão e especialistas frente a frente.

Onde a IA iguala o julgamento humano
Para perguntas simples de resposta única, os sistemas de IA—especialmente GPT-4o e Qwen—desempenharam notavelmente bem. Ao decidir se um anúncio continha álcool, a concordância entre esses modelos e as nutricionistas foi superior a 90% e quase indistinguível da concordância entre as próprias nutricionistas. Para classificar a quem o anúncio era direcionado principalmente e que tipo de anunciante era, as IAs novamente atingiram níveis de concordância que se situavam dentro da variação natural observada entre codificadores humanos diferentes. Em outras palavras, para características claras como “contém álcool ou não” e público-alvo ou tipo de marca simples, os melhores sistemas de IA já operam aproximadamente no nível humano.
Onde as coisas ficam confusas e discordantes
O desempenho caiu para perguntas mais complicadas com múltiplas respostas. Quando os codificadores precisaram identificar várias ofertas possíveis (descontos, concursos, programas de fidelidade), estratégias de marketing (eventos, personagens, endossos) ou categorias alimentares detalhadas (como lanches, refeições prontas ou laticínios), a concordância caiu de forma perceptível para todos—humanos e IAs. Mesmo as nutricionistas, que são especialistas em nutrição, frequentemente discordavam entre si, especialmente sobre táticas de marketing mais abstratas. Para alguns rótulos de estratégia de marketing, a concordância par a par entre nutricionistas podia ser extremamente baixa, mostrando que a tarefa em si é difícil e um tanto subjetiva. Nesse contexto, a IA não ficou claramente atrás dos humanos; em vez disso, comportou-se como um avaliador humano adicional, relativamente ruidoso.

Viéses ocultos na forma como a IA vê anúncios
Olhando além das pontuações gerais, os autores examinaram como os modelos consistentemente sobrediagnosticavam ou subdiagnosticavam rótulos específicos. Em várias perguntas, todas as IAs mostraram relutância em escolher opções que significavam “nenhum” ou “não aplicável”, tendendo em vez disso a atribuir ao menos uma característica concreta. Isso cria o risco de superestimar a frequência com que ofertas especiais ou táticas persuasivas estão presentes. Alguns modelos, como Gemma e Qwen, exibiram vieses mais fortes do que outros: por exemplo, frequentemente sinalizavam eventos e refeições prontas mesmo quando os codificadores humanos não o faziam. O GPT-4o geralmente mostrou padrões mais moderados e conservadores, mas ainda tinha pontos cegos—por exemplo, ofertas de desconto e endossos de celebridades ou instituições de caridade. Essas peculiaridades sistemáticas significam que confiar em um único sistema de IA pode distorcer as estimativas sobre quanto as pessoas são expostas a determinadas táticas de marketing ou tipos de alimentos.
Diretrizes para usar IA no mundo real
Para traduzir seus resultados em prática, os autores propõem uma estratégia em três níveis. No primeiro nível, tarefas relativamente simples de resposta única—como detectar álcool, tipo básico de anúncio ou principal grupo-alvo—estão prontas para automação em larga escala, com a IA assumindo grande parte do trabalho manual após uma pequena validação local. O segundo nível abrange perguntas mais complexas com múltiplas respostas sobre ofertas, estratégias e categorias alimentares detalhadas. Aqui, a IA pode ser uma assistente útil para pré-selecionar anúncios, sugerir rótulos ou orientar revisores humanos, mas a supervisão humana e definições melhores de rótulos continuam cruciais. Um terceiro nível inclui áreas ainda mais intrincadas ou não testadas, como outras substâncias nocivas ou detalhes nutricionais de alta granularidade, em que os resultados da IA devem atualmente ser tratados como exploratórios em vez de confiáveis.
O que isso significa para consumidores e políticas
Em termos simples, o estudo mostra que a IA atual já pode ajudar agências de saúde pública e pesquisadores a monitorar aspectos diretos da publicidade de alimentos e álcool na escala das redes sociais modernas. No entanto, quando se trata de truques de venda sutis e categorias alimentares complexas, tanto humanos quanto máquinas ainda têm dificuldades para concordar, e os modelos de IA carregam vieses reconhecíveis. Os autores concluem que combinar cuidadosamente IA com conhecimento humano—usando IA onde ela é mais forte e humanos onde nuance e interpretação importam—oferece o caminho mais promissor para um monitoramento justo e eficaz de como produtos pouco saudáveis são promovidos online.
Citação: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x
Palavras-chave: publicidade de alimentos, marketing de álcool, inteligência artificial, mídias sociais, política de saúde pública