Clear Sky Science · ru

Оценка моделей ИИ для классификации рекламы еды и алкоголя в сравнении с человеческими эталонами

2026-03-11 · Назад к списку

Почему важно отслеживать рекламные объявления в интернете

Каждый день люди пролистывают множество объявлений о еде и алкоголе в социальных сетях, часто не замечая, насколько сильно эти сообщения могут влиять на то, что мы едим и пьем. Организации здравоохранения и исследователи хотят контролировать, насколько активно продвигаются вредные продукты, особенно среди детей и подростков, но ручная проверка тысяч объявлений занимает много времени и требует ресурсов. В этом исследовании поставлен своевременный вопрос: могут ли современные системы искусственного интеллекта выполнять такую работу мониторинга так же надежно, как люди, а если да — для каких типов признаков объявлений им уже можно доверять?

Как исследование изучало объявления из реального мира

Исследователи собрали 1000 рекламных объявлений в Facebook от 77 крупных бельгийских брендов еды, напитков и алкоголя, включая изображения и подписи к ним. Около 600 представителей широкой публики, три подготовленных диетолога и четыре продвинутых системы ИИ оценивали одни и те же объявления. Для каждого объявления они отвечали на вопросы, например: содержится ли алкоголь, на кого, по их мнению, нацелена реклама (дети, подростки или взрослые), к какому типу рекламодателя она относится и какие рекламные приёмы или категории продуктов видны. Некоторые вопросы подразумевали только один ответ, например да–нет для наличия алкоголя. Другие позволяли выбрать несколько вариантов, например разные маркетинговые приёмы или несколько типов продуктов в одном объявлении. Такая схема позволила команде напрямую сравнить ИИ, краудсорсинговых рецензентов и экспертов.

Где ИИ соответствует человеческому суждению

Для простых вопросов с одним ответом системы ИИ — особенно GPT-4o и Qwen — показали впечатляющие результаты. При определении наличия алкоголя согласованность этих моделей с диетологами превышала 90 процентов и едва отличалась от согласованности между самими диетологами. При классификации основной целевой аудитории и типа рекламодателя ИИ также достигал уровней согласия, укладывающихся в естественную вариативность между разными человеческими кодерами. Иными словами, для однозначных признаков, таких как «алкоголь — да или нет» и простых категорий аудитории или типа бренда, лучшие системы ИИ уже работают примерно на уровне человека.

Где возникают трудности и разногласия

Эффективность падала для более сложных вопросов с несколькими ответами. Когда кодерам нужно было указать несколько возможных специальных предложений (скидки, конкурсы, программы лояльности), маркетинговых приёмов (мероприятия, персонажи, одобрения) или точных категорий продуктов (например, закуски, готовые блюда или молочные продукты), согласованность заметно снижалась как у людей, так и у ИИ. Даже диетологи, специалисты по питанию, часто не совпадали во мнениях, особенно по абстрактным маркетинговым тактикам. Для некоторых меток маркетинговых стратегий попарная согласованность между диетологами могла быть крайне низкой, что показывает, что сама задача сложна и во многом субъективна. В этом контексте ИИ не отставал явно от людей; он вел себя скорее как дополнительный, относительно шумный человеческий рецензент.

Скрытые смещения в том, как ИИ видит рекламу

Вне общих показателей авторы проанализировали, какие метки модели систематически пере- или недодиагностируют. Во всех задачах ИИ сдержанно относились к вариантам «нет» или «неприменимо», предпочитая по крайней мере одну конкретную характеристику. Это создает риск завышения частоты наличия специальных предложений или убедительных приёмов. Некоторые модели, например Gemma и Qwen, проявляли более выраженные смещения: они чаще помечали мероприятия и готовые блюда даже тогда, когда человеческие кодеры этого не делали. GPT-4o в целом демонстрировал более мягкие, консервативные паттерны, но у него тоже были слепые зоны — к примеру, по скидкам и одобрениям со стороны знаменитостей или благотворительных акций. Эти систематические особенности означают, что опора на единственную модель ИИ может исказить оценки того, насколько часто люди сталкиваются с определёнными маркетинговыми приёмами или категориями продуктов.

Что это значит для потребителей и политики

Проще говоря, исследование показывает: современный ИИ уже может помочь агентствам общественного здравоохранения и исследователям отслеживать простые аспекты рекламы еды и алкоголя в масштабах современных социальных сетей. Однако в случае тонких продажных приёмов и сложных категорий продуктов люди и машины до сих пор испытывают трудности с достижением согласия, а модели ИИ демонстрируют узнаваемые смещения. Авторы делают вывод, что наиболее перспективным подходом к справедливому и эффективному мониторингу продвижения вредных продуктов в интернете является тщательное сочетание ИИ и человеческой экспертизы — использовать ИИ там, где он силён, и полагаться на людей там, где важны нюансы и интерпретация.

Цитирование: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x

Ключевые слова: реклама продуктов питания, маркетинг алкоголя, искусственный интеллект, социальные сети, политика общественного здравоохранения