Clear Sky Science · ja

最小意味内容(MSC)データセット:計算美学研究のための大規模で均衡の取れた資源

· 一覧に戻る

写真の美しさは見た目ほど簡単に測れない理由

ある写真が美しく感じられ、別の写真が退屈あるいは醜いと感じられるのはなぜでしょうか。色、コントラスト、パターンなどを測れば答えが出ると思うかもしれません。しかし問題があります:私たちの反応は、その写真が何を写しているか—人々、場所、記号、記憶—と絡み合っているのです。この記事は、そうした注意をそらす要素をできるだけ排し、画像そのものの見た目に対する目と脳の反応に研究者が集中できるよう工夫された、新しい慎重に設計された画像コレクションを紹介します。

写真から物語を取り除く

研究で広く使われている人気の画像データベースの多くは、オンラインの写真共有サイトやコンテストから構築されています。これらの出典にはタイトルやテーマ、文化的参照が伴い、人々の評価に静かに影響を与えます。コンテストのテーマに合った巧妙なジョークは、見た目は平凡な写真を勝たせることがあります。旗のような強い象徴は、視覚的要素ではなく文化的理由で高得点を得ることがあります。さらに、人はめったに本当に酷い写真をアップロードしないため、既存のデータベースはまずまずあるいはそれ以上の写真で溢れています。これらが合わさると、高い評価が画像の構成—色、テクスチャ、形—によるものなのか、意味によるものなのかを判別するのが非常に難しくなります。

Figure 1
Figure 1.

静かな光景の世界を作る

この問題に取り組むため、著者らは最小意味内容(MSC)データベースを作成しました:物語性をできるだけ低く抑えつつ視覚的に豊かな1万点以上の画像です。彼らはパブリックドメインの写真や個人コレクションを出発点とし、人、動物、建物、文字、強い象徴的対象を含む写真を除外しました。また、強い記憶や感情を呼び起こしそうな絵葉書風の眺めも避けました。残ったのは主に自然の断片—葉、樹皮、岩、雲、水面、林床などです。こうした光景は完全に意味を欠くわけではありませんが、被写体がより均質であるため、人々の判断の差が誰や何が写っているかではなく、色、光、構造といった視覚的特性に由来する可能性が高くなります。

美しさと醜さを意図的に作る道具の考案

この精査を経ても、出発点のコレクションはなお見た目の良い画像に偏っていました。美を科学的に扱うには、非常に醜いものから非常に美しいものまで均等に広がる多くの例が必要です。そこでチームは「Uglifier」と呼ばれる簡単な編集プログラムを作りました。40人のボランティアがそれを使い、選ばれた画像を二方向に推し進めました:スライダーで明るさ、コントラスト、色の混合、シャープネス、ノイズ、トリミング、そしていくつかの高度な変換を調整して可能な限り美しくするか、あるいは可能な限り醜くするかです。研究者たちは編集のレシピの一部を記録し、それを他の画像に自動適用して、多数の追加された「醜い」変種を作成しました。こうして、オリジナル、加工して美しくしたもの、醜くしたもの、自動で醜くしたものが幅広く混在するデータ群が生まれました。

何千人もの人に視覚で投票してもらう

次に著者らは、オンラインゲームに組み込まれたクラウドソーシングプラットフォームに目を向け、世界中から1万人以上のプレイヤーを募集しました。MSCセットの各画像は100人の異なる非専門の閲覧者に表示され、簡単な5段階評価で非常に醜いから非常に美しいまでの評点を付けてもらいました。極端な例を示すトレーニングにより、評価者は尺度の全範囲を使えるようになりました。注意深い品質チェックでランダムにクリックしていると思われる参加者は除外されました。最終的に得られたのは、各シーンが豊富な評価履歴で裏付けられ、醜い画像、平均的な画像、美しい画像が中央に偏ることなく十分に表現された画像コレクションです。

これが示す美しさと視覚構造について

この均衡の取れたデータセットを手に、チームはコントラスト、色の変動性、エッジ密度、対称性、フラクタルのようなテクスチャといった数十の基本的な画像特性と美点評価との関連を調べました。評価が醜い—美しいの範囲に均等に広がると、これらの低レベル特性と人々の判断との結び付きはより明瞭になり、しばしば強くなることがわかりました。場合によっては、従来の偏ったデータベースで見られた関係の向きが逆転することさえありました。また、Uglifierが狭く人工的な醜さを生み出していないかも確認しました。結果として、編集画像は自然に低評価を受けるオリジナル画像と類似した基本統計を共有しており、操作は漫画的な極端さではなく実際の視覚的傾向を捉えていることが示唆されました。

Figure 2
Figure 2.

嗜好理解にとっての意義

一般読者への要点は、研究者が視覚的嗜好をより純度高く研究できるようになったということです。MSCデータベースは、誰や何を表すかではなく主に見た目に依存する静かな、主に自然の光景の世界を提供します。これは、画像の構造だけから美的嗜好を予測しようとする心理学、神経科学、人工知能の研究にとって強力な試験場となります。後から、より複雑な意味や文化的文脈を重ねることもできます。非常に少ししか語らないが見た目が多様な写真から始めることで、MSCプロジェクトは心が物語を付け加える前にどれだけの美の感覚が目から生じるかを明らかにする助けとなります。

引用: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0

キーワード: 視覚的美学, 画像データベース, クラウドソースによる評価, 計算による美, 自然のテクスチャ