Clear Sky Science · de
Der Datensatz Minimum Semantic Content (MSC): Eine große, ausgewogene Ressource für die Forschung zur computergestützten Ästhetik
Warum Schönheit in Bildern schwerer zu messen ist, als es scheint
Warum erscheinen uns manche Fotos als schön, während andere langweilig oder sogar hässlich wirken? Man könnte glauben, Wissenschaftler könnten das durch Messung von Farben, Kontrast oder Mustern in einem Bild beantworten. Doch es gibt ein Problem: Unsere Reaktionen sind verknüpft mit dem, was das Bild zeigt—Menschen, Orte, Symbole und Erinnerungen. Dieser Artikel stellt eine neue, sorgfältig gestaltete Bildsammlung vor, die versucht, diese Ablenkungen zu entfernen, damit Forschende sich darauf konzentrieren können, wie Auge und Gehirn auf das reine Erscheinungsbild eines Bildes reagieren.
Die Geschichte aus dem Bild herausnehmen
Die meisten populären Bilddatenbanken, die in der Forschung verwendet werden, stammen von Online-Fotoportalen und Wettbewerben. Diese Quellen bringen Titel, Themen und kulturelle Bezüge mit, die subtil beeinflussen, wie Menschen sie bewerten. Ein cleverer Witz, der zu einem Wettbewerbsthema passt, kann ein mittelmäßig aussehendes Bild gewinnen lassen. Starke Symbole, wie Flaggen, können aus kulturellen Gründen hoch bewertet werden statt aus rein visuellen. Außerdem laden Menschen selten wirklich schlechte Fotos hoch, sodass bestehende Datenbanken überwiegend anständige oder bessere Bilder enthalten. Zusammengenommen macht das sehr schwer zu unterscheiden, ob eine hohe Bewertung von der Bildgestaltung—Farben, Texturen und Formen—oder von seiner Bedeutung herrührt. 
Eine Welt ruhiger Szenen aufbauen
Um dem zu begegnen, erstellten die Autorinnen und Autoren die Minimum Semantic Content (MSC) Datenbank: über zehntausend Bilder, die visuell reich, aber möglichst arm an "Geschichte" sind. Sie begannen mit gemeinfreien Fotos und privaten Sammlungen und entfernten dann alle Bilder mit Menschen, Tieren, Gebäuden, Schrift oder starken symbolischen Objekten. Außerdem vermieden sie Postkartenansichten, die wahrscheinlich starke Erinnerungen oder Emotionen hervorrufen. Was übrig blieb, sind größtenteils Naturfragmente—Blätter, Rinde, Steine, Wolken, Wasseroberflächen und Waldböden. Diese Szenen sind nicht völlig bedeutungslos, aber sie sind thematisch viel einheitlicher. Das macht es wahrscheinlicher, dass Unterschiede in den Urteilen der Menschen von visuellen Qualitäten wie Farbe, Licht und Struktur herrühren statt davon, wer oder was dargestellt ist.
Ein Werkzeug erfinden, um Schönheit und Hässlichkeit auf Abruf zu erzeugen
Selbst mit dieser sorgfältigen Filterung neigte die Ausgangssammlung noch zu angenehmer wirkenden Bildern. Um Schönheit wissenschaftlich gut zu erfassen, brauchen Forschende viele Beispiele, die gleichmäßig vom sehr Hässlichen bis zum sehr Schönen verteilt sind. Das Team baute daher ein einfaches Bearbeitungsprogramm, das den Spitznamen „Uglifier" erhielt. Vierzig Freiwillige nutzten es, um ausgewählte Bilder in zwei Richtungen zu treiben: sie so schön wie möglich oder so hässlich wie möglich zu machen, indem sie Regler für Helligkeit, Kontrast, Farbmix, Schärfe, Rauschen, Beschnitt und einige weiterführende Transformationen anpassten. Die Forschenden zeichneten außerdem einige dieser Bearbeitungsrezepte auf und wendeten sie automatisch auf andere Bilder an, wodurch eine große Menge zusätzlicher „hässlicher" Varianten entstand. So entstand eine breite Mischung aus Originalen, verschönerten, verschandelten und automatisch verschandelten Szenen.
Tausende Menschen mit den Augen abstimmen lassen
Anschließend wandten sich die Autorinnen und Autoren einer Crowdsourcing-Plattform zu, die in ein Onlinespiel integriert war, und rekrutierten mehr als zehntausend Spieler weltweit. Jedes Bild im MSC-Set wurde einhundert verschiedenen Nicht-Expertinnen und -Experten gezeigt, die seine Schönheit auf einer einfachen fünfstufigen Skala von sehr hässlich bis sehr schön bewerteten. Trainingsbeispiele an den Extremen halfen den Leuten, die gesamte Skala zu nutzen. Sorgfältige Qualitätsprüfungen entfernten Spieler, die offenbar zufällig klickten. Das Endergebnis ist eine Bildsammlung, bei der jede Szene durch eine umfassende Bewertungshistorie gestützt wird und bei der hässliche, durchschnittliche und schöne Bilder gut vertreten sind statt in der Mitte zu liegen.
Was das über Schönheit und visuelle Struktur verrät
Mit diesem ausgewogenen Datensatz untersuchte das Team, wie dutzende grundlegende Bildeigenschaften—wie Kontrast, Farbvariabilität, Kantendichte, Symmetrie und fraktalähnliche Textur—mit Schönheitsbewertungen zusammenhängen. Sie fanden heraus, dass bei gleichmäßig über das Hässlich–Schön-Spektrum verteilten Scores die Verbindungen zwischen diesen niedrigstufigen Eigenschaften und den Urteilen der Menschen klarer und oft stärker werden. In manchen Fällen kehrt sich die Richtung der Beziehung sogar um im Vergleich zu älteren, verzerrten Datenbanken. Sie überprüften auch, ob der Uglifier eine enge, künstliche Art von Hässlichkeit erzeugte; stattdessen zeigten die bearbeiteten Bilder ähnliche grundlegende Statistiken wie natürlich niedrig bewertete Originale, was nahelegt, dass die Manipulationen reale visuelle Tendenzen einfingen statt karikaturhafter Extreme. 
Warum das für das Verständnis von Geschmack wichtig ist
Für eine allgemeine Leserschaft lautet die Schlussfolgerung, dass Wissenschaftlerinnen und Wissenschaftler nun visuellen Geschmack sauberer untersuchen können. Die MSC-Datenbank bietet eine Welt ruhiger, überwiegend natürlicher Szenen, in der Schönheit und Hässlichkeit hauptsächlich davon abhängen, wie Dinge aussehen, nicht davon, wen oder was sie repräsentieren. Das macht sie zu einer leistungsstarken Testumgebung für Psychologie, Neurowissenschaften und künstliche Intelligenz, die ästhetische Präferenzen allein aus der Struktur von Bildern vorhersagen wollen. Später können komplexere Bedeutungsebenen und kultureller Kontext wieder hinzugefügt werden. Indem man mit Bildern beginnt, die sehr wenig aussagen und sehr unterschiedlich aussehen, hilft das MSC-Projekt zu klären, wie viel unseres Schönheitsempfindens bereits vom Auge erzeugt wird, bevor der Geist seine Geschichten hinzufügt.
Zitation: Penacchio, O., Javed, A., Raducanu, B. et al. The Minimum Semantic Content (MSC) Dataset: A Large, Balanced Resource for Computational Aesthetics Research. Sci Data 13, 470 (2026). https://doi.org/10.1038/s41597-026-06816-0
Schlüsselwörter: visuelle Ästhetik, Bilddatenbank, crowdsourced Bewertungen, computationale Schönheit, natürliche Texturen