Clear Sky Science · es

Evaluación de modelos de IA para la clasificación de anuncios de alimentos y alcohol frente a referencia humana

2026-03-11 · Volver al índice

Por qué importa rastrear los anuncios en línea

Cada día, la gente desplaza la vista por innumerables anuncios de alimentos y alcohol en las redes sociales, a menudo sin percibir cuánto pueden influir estos mensajes en lo que comemos y bebemos. Las agencias de salud y los investigadores quieren vigilar cuánto se promocionan los productos poco saludables, especialmente ante niños y adolescentes, pero revisar manualmente miles de anuncios es lento y costoso. Este estudio plantea una pregunta oportuna: ¿pueden los sistemas modernos de inteligencia artificial realizar este trabajo de monitorización con la misma fiabilidad que las personas y, en tal caso, para qué tipos de características de los anuncios ya podemos confiar en ellos?

Cómo el estudio analizó anuncios del mundo real

Los investigadores recopilaron 1000 anuncios de Facebook de 77 marcas belgas importantes de alimentos, bebidas y alcohol, incluyendo tanto las imágenes como sus textos. Unas 600 personas del público general, tres dietistas formadas y cuatro sistemas avanzados de IA examinaron los mismos anuncios. Para cada anuncio respondieron preguntas como si había alcohol presente, a quién parecía dirigirse el anuncio (niños, adolescentes o adultos), qué tipo de anunciante era y qué tácticas de venta o categorías alimentarias aparecían. Algunas preguntas admitían una sola respuesta, como la decisión binaria sobre alcohol. Otras permitían respuestas múltiples, por ejemplo varias ofertas promocionales o varios tipos de alimentos en el mismo anuncio. Este diseño permitió al equipo comparar IA, trabajadores del público y expertos cara a cara.

Dónde la IA iguala el juicio humano

Para preguntas simples de respuesta única, los sistemas de IA—especialmente GPT-4o y Qwen—tuvieron un rendimiento notable. Al decidir si un anuncio contenía alcohol, la concordancia entre estos modelos y los dietistas superó el 90 por ciento y fue casi indistinguible de la concordancia entre los propios dietistas. Para clasificar a quién iba dirigido el anuncio principalmente y qué tipo de anunciante era, las IAs también alcanzaron niveles de acuerdo que se situaban dentro de la variación natural observada entre distintos codificadores humanos. En otras palabras, para características claras como «alcohol o no» y audiencias o tipos de marca sencillos, los mejores sistemas de IA ya funcionan aproximadamente a nivel humano.

Dónde las cosas se vuelven confusas y hay desacuerdo

El rendimiento cayó en preguntas más complejas con respuestas múltiples. Cuando los codificadores debían identificar varias ofertas posibles (descuentos, concursos, programas de fidelidad), estrategias de marketing (eventos, personajes, respaldos) o categorías alimentarias detalladas (como snacks, platos preparados o lácteos), el acuerdo fue visiblemente menor para todos: humanos e IAs por igual. Incluso los dietistas, que son especialistas en nutrición, a menudo discreparon entre sí, especialmente sobre tácticas de marketing abstractas. Para algunas etiquetas de estrategia de marketing, el acuerdo por pares entre dietistas pudo ser extremadamente bajo, lo que muestra que la tarea en sí es difícil y algo subjetiva. En este contexto, la IA no quedó claramente rezagada respecto a los humanos; más bien, se comportó como un evaluador humano adicional y relativamente ruidoso.

Sesgos ocultos en cómo la IA ve los anuncios

Más allá de las puntuaciones globales, los autores examinaron cómo los modelos tendían a sobredetectar o subdetectaretiquetas específicas. En todas las preguntas, las IAs mostraron reticencia a elegir opciones que implicaban «ninguna» o «no aplicable», tendiendo en su lugar a asignar al menos una característica concreta. Esto crea el riesgo de exagerar la frecuencia de ofertas especiales o tácticas persuasivas. Algunos modelos, como Gemma y Qwen, mostraron sesgos más fuertes que otros: por ejemplo, señalaban con frecuencia eventos y platos preparados incluso cuando los codificadores humanos no lo hacían. GPT-4o mostró patrones generalmente más suaves y conservadores, pero aún así tenía puntos ciegos—por ejemplo, ofertas con descuento y respaldos por celebridades o asociaciones benéficas. Estos rasgos sistemáticos implican que confiar en un único sistema de IA podría sesgar las estimaciones sobre cuánto está expuesta la gente a determinadas tácticas de marketing o tipos de alimentos.

Guías para usar la IA en el mundo real

Para trasladar sus resultados a la práctica, los autores proponen una estrategia de tres niveles. En el primer nivel, tareas relativamente simples de respuesta única—como detectar alcohol, el tipo básico de anuncio o el grupo objetivo principal—están listas para la automatización a gran escala, con la IA haciéndose cargo de gran parte del trabajo manual tras una pequeña validación local. El segundo nivel abarca preguntas más complejas con respuestas múltiples sobre ofertas, estrategias y categorías alimentarias detalladas. Aquí, la IA puede ser un asistente útil para preseleccionar anuncios, sugerir etiquetas o guiar a los revisores humanos, pero la supervisión humana y definiciones de etiquetas más claras siguen siendo cruciales. Un tercer nivel incluye áreas aún más intrincadas o no probadas, como otras sustancias dañinas o detalles nutricionales finos, donde las salidas de la IA deben tratarse actualmente como exploratorias más que fiables.

Qué significa esto para consumidores y políticas

En términos sencillos, el estudio muestra que la IA actual ya puede ayudar a agencias de salud pública e investigadores a vigilar aspectos sencillos de la publicidad de alimentos y alcohol a la escala de las redes sociales modernas. Sin embargo, cuando se trata de trucos de venta sutiles y categorías alimentarias complejas, tanto humanos como máquinas aún tienen dificultades para ponerse de acuerdo, y los modelos de IA presentan sesgos reconocibles. Los autores concluyen que combinar cuidadosamente la IA con la pericia humana—usar IA donde es más fuerte y humanos donde importan la sutileza y la interpretación—ofrece la vía más prometedora para una monitorización justa y eficaz de cómo se promocionan en línea los productos poco saludables.

Cita: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x

Palabras clave: publicidad de alimentos, marketing de alcohol, inteligencia artificial, redes sociales, política de salud pública