Clear Sky Science · fr
Le jeu de données Minimum Semantic Content (MSC) : une grande ressource équilibrée pour la recherche en esthétique computationnelle
Pourquoi la beauté des images est plus difficile à mesurer qu’il n’y paraît
Pourquoi certaines photos nous paraissent-elles belles tandis que d’autres semblent ternes voire laides ? On pourrait penser que les scientifiques peuvent répondre en mesurant les couleurs, le contraste ou les motifs d’une image. Mais il y a un problème : nos réactions sont mêlées à ce que l’image montre — des personnes, des lieux, des symboles et des souvenirs. Cet article présente une nouvelle collection d’images soigneusement conçue qui cherche à éliminer ces distractions afin que les chercheurs puissent se concentrer sur la façon dont l’œil et le cerveau réagissent à l’aspect brut d’une image elle‑même.
Retirer l’histoire de l’image
La plupart des bases d’images populaires utilisées en recherche proviennent de sites de partage de photos et de concours en ligne. Ces sources sont accompagnées de titres, de thèmes et de références culturelles qui influencent discrètement la manière dont les gens les évaluent. Une plaisanterie astucieuse adaptée au thème d’un concours peut faire gagner une photo médiocre. Des symboles puissants, comme des drapeaux, peuvent obtenir de bons scores pour des raisons culturelles plutôt que visuelles. De plus, les gens téléchargent rarement de vraies mauvaises photos, si bien que les bases existantes sont remplies d’images correctes ou meilleures. Ensemble, ces facteurs rendent très difficile de savoir si une note élevée provient de la construction visuelle de l’image — ses couleurs, textures et formes — ou de ce qu’elle signifie. 
Construire un univers de scènes discrètes
Pour y remédier, les auteurs ont créé la base de données Minimum Semantic Content (MSC) : plus de dix mille images choisies pour être visuellement riches mais aussi dépourvues d’« histoire » que possible. Ils ont commencé par des photos du domaine public et des collections personnelles, puis ont retiré toutes les images contenant des personnes, des animaux, des bâtiments, des écritures ou des objets symboliques marqués. Ils ont aussi évité les vues de type carte postale susceptibles d’évoquer des souvenirs ou des émotions fortes. Ce qui reste sont principalement des fragments de nature — feuilles, écorce, rochers, nuages, surfaces d’eau et sols de forêt. Ces scènes ne sont pas complètement dénuées de sens, mais elles sont beaucoup plus homogènes en sujet. Cela rend plus probable que les différences dans les jugements des gens proviennent de qualités visuelles comme la couleur, la lumière et la structure plutôt que de qui ou de quoi est représenté.
Inventer un outil pour créer beauté et laideur à la demande
Même avec ce filtrage soigné, la collection de départ penchait encore vers des images agréables. Pour obtenir une bonne portée scientifique sur la beauté, les chercheurs ont besoin de nombreux exemples répartis uniformément de très laids à très beaux. L’équipe a donc construit un programme d’édition simple surnommé « Uglifier ». Quarante bénévoles l’ont utilisé pour pousser des images sélectionnées dans deux directions : les rendre aussi belles que possible, ou aussi laides que possible, en ajustant des curseurs pour la luminosité, le contraste, le mélange des couleurs, la netteté, le bruit, le cadrage et quelques transformations plus avancées. Les chercheurs ont également enregistré certaines de ces recettes d’édition et les ont appliquées automatiquement à d’autres images, ajoutant un grand lot de variantes « laides » supplémentaires. Cela a produit un mélange étendu d’originaux, d’embellissements, d’avilissements et de versions automatiquement avilies.
Demander à des milliers de personnes de voter avec leurs yeux
Puis, les auteurs se sont tournés vers une plateforme de crowdsourcing intégrée à un jeu en ligne, recrutant plus de dix mille joueurs dans le monde. Chaque image du jeu MSC a été montrée à cent spectateurs non experts différents, qui ont noté sa beauté sur une simple échelle en cinq points, allant de très laid à très beau. Des exemples de formation aux extrêmes ont aidé les gens à utiliser toute la plage de l’échelle. Des contrôles de qualité rigoureux ont écarté les joueurs semblant cliquer au hasard. Le résultat final est une collection d’images où chaque scène est soutenue par un riche historique de notes, et où images laides, moyennes et belles sont toutes bien représentées plutôt que regroupées au milieu.
Ce que cela révèle sur la beauté et la structure visuelle
Avec ce jeu de données équilibré en main, l’équipe a examiné comment des dizaines de propriétés d’image de bas niveau — telles que le contraste, la variabilité des couleurs, la densité des contours, la symétrie et la texture de type fractale — se rapportent aux notes de beauté. Ils ont constaté que lorsque les scores sont répartis uniformément sur l’axe laid–beau, les liens entre ces propriétés de bas niveau et les jugements des personnes deviennent plus clairs et souvent plus forts. Dans certains cas, le sens de la relation s’inverse même par rapport à ce qui est observé dans d’anciennes bases biaisées. Ils ont aussi vérifié si l’Uglifier produisait un type de laideur étroit et artificiel ; au lieu de cela, les images éditées partageaient des statistiques de base similaires avec des originaux naturellement mal notés, ce qui suggère que les manipulations ont capturé des tendances visuelles réelles plutôt que des extrêmes caricaturaux. 
Pourquoi cela compte pour la compréhension du goût
Pour un lecteur non spécialiste, la conclusion est que les scientifiques peuvent désormais étudier le goût visuel de manière plus nette. La base MSC offre un univers de scènes sobres, majoritairement naturelles, où la beauté et la laideur dépendent principalement de l’apparence — et non de qui ou de quoi elles représentent. Cela en fait un terrain d’essai puissant pour la psychologie, les neurosciences et la recherche en intelligence artificielle visant à prédire la préférence esthétique à partir de la structure des images seules. Par la suite, un sens plus complexe et le contexte culturel pourront être réintroduits. En commençant par des images qui disent très peu et qui se ressemblent tout en étant très différentes visuellement, le projet MSC aide à clarifier dans quelle mesure notre sens de la beauté provient de l’œil avant que l’esprit n’ajoute ses histoires.
Citation: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0
Mots-clés: esthétique visuelle, base d'images, notations participatives, beauté computationnelle, textures naturelles