Clear Sky Science · ja
人間の基準と比較した食品・アルコール広告分類におけるAIモデルの評価
なぜオンライン広告の追跡が重要なのか
人々は毎日ソーシャルメディア上で数え切れないほどの食品やアルコールの広告に目を通しますが、こうしたメッセージが私たちの食習慣や飲酒行動にどれほど強く影響するかに気づかないことが多いです。保健機関や研究者は、特に子どもやティーンに対して不健康な製品がどれだけ大量に宣伝されているかを把握したいと考えていますが、何千もの広告を手作業で調べるのは遅く、費用もかかります。本研究は時宜を得た問いを提示します:現代の人工知能システムは、人間と同程度にこの監視作業を行えるのか、そしてもし可能ならば、どの種類の広告特徴について既に信頼できるのか、という点です。
実際の広告をどう調べたか
研究者たちはベルギーの主要な食品・飲料・アルコールブランド77社から、画像とキャプションを含む1000件のFacebook広告を収集しました。一般の参加者約600名、訓練を受けた管理栄養士3名、そして4つの先進的なAIシステムが同じ広告を評価しました。各広告について、アルコールが含まれているか、広告の想定対象(子ども、青少年、成人)は誰か、広告主の種類は何か、どのような販売手法や食品カテゴリが現れているかといった質問に答えました。ある質問はアルコールの有無のように単一の回答しか許されないものがあり、他の質問は割引や懸賞、ロイヤリティプログラムなど複数の選択肢を同時に選べる場合もありました。この設計により、AI、群衆(クラウドワーカー)、専門家を直接比較することが可能になりました。

AIが人間の判断に匹敵する領域
単純で単一回答の質問では、特にGPT-4oとQwenが顕著に良好な成績を示しました。広告にアルコールが含まれているかを判断する際、これらのモデルと管理栄養士との一致率は90%を超え、管理栄養士同士の一致率とほとんど差が見られませんでした。広告の主な対象や広告主の種類を分類する際にも、AIは人間のコーダー間で見られる自然なばらつきの範囲に収まる一致水準を達成しました。言い換えれば、「アルコールの有無」や明確な対象層やブランド種別といった判断しやすい特徴については、最良のAIシステムは既に大まかに人間レベルで動作しています。
意見が分かれやすく混乱しやすい領域
より複雑で複数回答を許す質問では性能が低下しました。割引、懸賞、ロイヤリティといった複数の特典の特定、イベント・キャラクター・推薦といったマーケティング手法の識別、スナックや調理済み食品、乳製品といった詳細な食品カテゴリの識別では、人間・AIの双方で一致が目に見えて低くなりました。栄養の専門家である管理栄養士間でもしばしば意見の相違が生じ、特に抽象的なマーケティング手法に関しては対立が大きくなりました。あるマーケティング戦略ラベルでは、管理栄養士間の二者間一致が非常に低い場合もあり、このタスク自体が難しくやや主観的であることを示しています。この文脈では、AIは明確に人間より劣っているというよりも、追加のややノイジーな人間評価者のように振る舞いました。

AIが広告をどう見誤るかに潜む偏り
全体的なスコアを超えて、著者らはモデルが特定のラベルを一貫して過大あるいは過小に検出する傾向を調べました。全体を通して、すべてのAIは「該当なし」や「適用不可」を選ぶことに消極的で、代わりに少なくとも一つの具体的特徴を割り当てる傾向がありました。これは特典や説得的手法が実際より多く存在するように見積もられるリスクを生みます。GemmaやQwenのようなモデルはいくつかのラベルで他より強いバイアスを示し、例えば人間のコーダーが示さない場合でもイベントや調理済み食品を頻繁に検出することがありました。GPT-4oは概してより穏やかで保守的な傾向を示しましたが、それでも割引提供や有名人・慈善団体による推薦などに関して盲点がありました。これらの体系的な偏りは、単一のAIシステムに依存すると特定のマーケティング手法や食品カテゴリへの曝露量の推定が歪む可能性があることを意味します。
実務でAIを使うための指針
結果を実務に生かすために、著者らは三層の戦略を提案しています。第一層では、アルコール検出、基本的な広告種別、主な対象グループといった比較的単純な単一回答タスクは大規模自動化に適しており、少量のローカルな検証チェックを行った上でAIに手作業の多くを委ねられます。第二層は、特典、戦略、詳細な食品カテゴリに関するより複雑な複数回答の問題で、ここではAIは広告の事前スクリーニング、ラベル提案、レビュー担当者の支援として有用ですが、人間の監視とラベル定義の改善が依然として重要です。第三層は、他の有害物質や細かい栄養情報のようなさらに複雑または未検証の領域で、現時点ではAIの出力を信頼できるものとしてではなく探索的なものとして扱うべき領域です。
消費者と政策にとっての意味
平たく言えば、本研究は、今日のAIがすでに公衆衛生機関や研究者が現代のソーシャルメディア規模で食品・アルコール広告の明確な側面を監視するのに役立つことを示しています。しかし、微妙な販売手法や複雑な食品カテゴリに関しては、人間も機械も依然として合意が得られにくく、AIモデルには認識可能なバイアスがあります。著者らは、AIをその強みのある領域で使い、解釈や細かい判断が必要なところでは人間の専門知識を組み合わせることが、不健康な製品がオンラインでどのように宣伝されているかを公平かつ効果的に監視するための最も有望な道だと結論づけています。
引用: Gitu, PA., Cerina, R., Grigoriev, A. et al. Evaluating AI models for food and alcohol advertisement classification against human benchmarks. Sci Rep 16, 13058 (2026). https://doi.org/10.1038/s41598-026-42426-x
キーワード: 食品広告, アルコールマーケティング, 人工知能, ソーシャルメディア, 公衆衛生政策