Clear Sky Science · ru
Набор данных «Минимальное семантическое содержание» (MSC): большой, сбалансированный ресурс для исследований вычислительной эстетики
Почему измерить красоту на фотографиях сложнее, чем кажется
Почему одни снимки кажутся нам красивыми, а другие — скучными или даже уродливыми? Можно подумать, что учёные просто измерят цвета, контраст или узоры на изображении. Но есть одна проблема: наши реакции переплетены с тем, что на картинке изображено — люди, места, символы и воспоминания. В этой статье представлен новый, тщательно подобранный набор изображений, который пытается отвести в сторону эти отвлекающие факторы, чтобы исследователи могли сосредоточиться на том, как глаз и мозг реагируют на саму визуальную форму изображения.
Убирая историю из кадра
Большинство популярных баз изображений, используемых в исследованиях, составляют из материалов с сайтов обмена фотографиями и конкурсов. Эти источники приходят с заголовками, темами и культурными отсылками, которые незаметно влияют на оценки. Остроумный комментарий, подходящий под тему конкурса, может сделать посредственный кадр победителем. Сильные символы, например флаги, получают высокие оценки по культурным причинам, а не по визуальным качествам. Кроме того, люди редко загружают по-настоящему плохие фото, поэтому существующие базы заполнены снимками как минимум среднего качества. В совокупности это затрудняет выяснить, вызвано ли высокое место в рейтинге конструкцией изображения — его цветами, текстурами и формами — или смыслом, который оно несёт. 
Создание мира спокойных сцен
Чтобы решить эту проблему, авторы создали базу данных Minimum Semantic Content (MSC): более десяти тысяч изображений, отобранных так, чтобы быть визуально богатыми, но максимально лишёнными «сюжета». Они начали с фотографий из общественного достояния и личных коллекций, затем исключили все кадры с людьми, животными, зданиями, текстом или ярко выраженными символическими объектами. Также избегали видов в духе открыток, которые могут вызывать сильные воспоминания или эмоции. В итоге остались в основном фрагменты природы — листья, кора, камни, облака, поверхность воды и лесная подстилка. Эти сцены не полностью лишены смысла, но предметность значительно более однородна. Это делает различия в суждениях людей более вероятно связанными с визуальными качествами — цветом, светом и структурой — а не с тем, кто или что изображено.
Изобретение инструмента, позволяющего создавать красоту и уродство по запросу
Даже после такой фильтрации исходная коллекция всё ещё была склонна к приятным изображениям. Для строгого научного анализа красоты нужно много примеров, равномерно распределённых от очень уродливых до очень красивых. Поэтому команда создала простой редактор, прозванный «Uglifier» (Угрожатель). Сорок добровольцев использовали его, чтобы менять выбранные изображения в двух направлениях: делать их как можно красивее или как можно уродливее, регулируя ползунки яркости, контраста, цветовой смеси, резкости, шума, кадрирования и нескольких более сложных преобразований. Исследователи также записали некоторые из этих «рецептов» редактирования и автоматически применили их к другим изображениям, добавив большую партию автоматически испорченных вариантов. В результате получилась богатая смесь оригиналов, украшенных, уродливых и автоматически уродливых сцен.
Просьба к тысячам людей проголосовать глазами
Затем авторы обратились к краудсорсинговой платформе, встроенной в онлайн-игру, привлекая более десяти тысяч игроков по всему миру. Каждое изображение из набора MSC показывали ста разным непрофессиональным зрителям, которые оценивали его красоту по простой пятибалльной шкале от «очень уродливо» до «очень красиво». Обучающие примеры на крайних значениях помогали людям использовать весь диапазон шкалы. Тщательные проверки качества отсеивали игроков, которые, по-видимому, кликали случайно. В итоге получилась коллекция изображений, где за каждой сценой стоит богатая история оценок, а уродливые, средние и красивые изображения представлены равномерно, а не сосредоточены в середине.
Что это показывает о красоте и визуальной структуре
Имея этот сбалансированный набор данных, команда изучила, как десятки базовых свойств изображения — такие как контраст, вариативность цвета, плотность краёв, симметрия и фрактально-подобная текстура — соотносятся с оценками красоты. Они обнаружили, что при равномерном распределении оценок по шкале от уродливого до красивого связи между этими низкоуровневыми свойствами и человеческими суждениями становятся яснее и часто сильнее. В некоторых случаях направление связи даже меняется по сравнению с наблюдаемым в старых, смещённых базах. Также проверили, не создаёт ли Uglifier узкий, искусственный тип уродства; оказалось, что отредактированные изображения по базовым статистикам схожи с естественно низко оценёнными оригиналами, что говорит о том, что манипуляции захватывают реальные визуальные тенденции, а не карикатурные крайности. 
Почему это важно для понимания вкуса
Для неподготовленного читателя вывод таков: учёные теперь могут изучать визуальный вкус в более чистом виде. База MSC предлагает мир спокойных, преимущественно природных сцен, где красота и уродство в основном зависят от того, как вещи выглядят, а не от того, кто или что на изображении. Это делает её мощной испытательной площадкой для психологии, нейронауки и исследований искусственного интеллекта, стремящихся предсказать эстетические предпочтения на основе структуры изображений. Затем можно снова добавить более сложный смысл и культурный контекст. Начав с картин, которые почти ничего не говорят и при этом сильно различаются внешне, проект MSC помогает прояснить, какая часть нашего чувства красоты возникает в глазу до того, как разум добавит свои истории.
Цитирование: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0
Ключевые слова: визуальная эстетика, база изображений, оценки краудсорса, вычисляемая красота, натуральные текстуры