Clear Sky Science · de

Ein KI-generiertes Modell zur Kunstevaluation, das rechnerische Ästhetik und kognitive Psychologie integriert

2026-04-01 · Zurück zur Übersicht

Warum die Bewertung von KI‑erstellter Kunst wichtig ist

Während KI-Systeme unsere Bildschirme mit Gemälden, Fotos und Designs überschwemmen, verstehen wir immer noch nicht vollständig, wie Menschen entscheiden, ob diese maschinell erzeugte Kunst schön ist, oder wie Computer diese Aufgabe sinnvoll teilen könnten. Diese Studie schlägt eine Brücke zwischen dem, wie Psychologen annehmen, dass der Geist auf Kunst reagiert, und dem, wie KI‑Modelle Bilder bewerten, mit dem Ziel, automatisierte Kunstbewertungen stärker an menschliche Erfahrungen anzupassen und leichter nachvollziehbar zu machen.

Verbindung von menschlichen Empfindungen und maschinellen Bewertungen

Die meisten bestehenden Bildbewertungssysteme behandeln Schönheit als eine Black‑Box‑Zahl. Im Gegensatz dazu beginnt diese Arbeit bei bekannten Ideen aus der Psychologie: Menschen mögen Bilder, die leicht zu verarbeiten sind, eine klare Struktur haben und Vertrautheit mit Neuheit ausbalancieren. Der Autor überführt diese Ideen in ein schrittweises KI‑Modell, das nachahmt, wie Betrachter vom Rohsehen zu einem Gesamtgefühl für ein Bild gelangen. Das Design kombiniert grundlegende visuelle Organisation, eine Messung der Interpretationsschwierigkeit eines Bildes und zwei unterschiedliche Wege, um ein Urteil schnell oder langsam zu fällen.

Figure 1. Wie Menschen und KI beim Beurteilen der Schönheit von KI-generierten Kunstbildern verglichen werden können.

Wie das neue Bewertungsmodell intern arbeitet

Das Modell organisiert zunächst jedes Bild in sinnvolle Regionen, was dem entspricht, wie unsere Augen Figur und Hintergrund trennen und Ähnlichkeiten, Gruppierungen und vollständige Formen wahrnehmen. Anschließend schätzt es ein, wie leicht das Bild zu verarbeiten ist, indem visuelle Unordnung, Vertrautheit mit typischen als angenehm empfundenen Mustern und der Grad der Neuheit kombiniert werden, wobei so abgestimmt ist, dass mäßige Überraschung Langeweile oder Verwirrung gegenüber bevorzugt wird. Darauf aufbauend laufen zwei Pfade gleichzeitig: ein schneller Weg, der das Gesamtbild und die Stimmung in einem Bruchteil einer Sekunde erfasst, und ein langsamerer Weg, der lokale Details, Texturen und Inhalte sorgfältiger prüft, bevor alles zu einer endgültigen ästhetischen Bewertung verschmolzen wird.

Das Modell im Praxistest mit Menschen

Um zu prüfen, ob diese Berechnungen wirklich der menschlichen Erfahrung entsprechen, rekrutierte die Studie 120 Freiwillige mit unterschiedlichem Kunstwissen. Sie betrachteten sowohl von Menschen geschaffene als auch KI‑generierte Kunstwerke, die von einfach bis visuell dicht reichten, bewerteten, wie sehr sie ihnen gefielen, und füllten Arbeitsbelastungsumfragen aus, in denen beschrieben wurde, wie mental anstrengend jede Betrachtung empfunden wurde. Ein Eye‑Tracker zeichnete auf, wohin und wie lange sie auf verschiedene Teile jedes Bildes schauten, und zusätzliche mündliche Berichte erfassten, wie sie ihre Entscheidungen begründeten. Diese reiche Mischung aus Reaktionszeiten, Blickmustern und Selbstberichten erlaubte einen direkten Vergleich zwischen den inneren Abläufen des Modells und dem tatsächlichen Betrachtungsverhalten der Menschen.

Figure 2. Wie ein KI-Modell ein Kunstwerk über schnelle und langsame visuelle Pfade verarbeitet, um ästhetische Attraktivität vorherzusagen.

Was die Vergleiche offenbarten

Die Bewertungen der KI zeigten eine starke Übereinstimmung mit menschlichen Urteilen, nahe der Übereinstimmung, die üblicherweise zwischen verschiedenen Personen beobachtet wird. Ihre Vorhersagen stimmten besonders gut für Bilder mit klarer Struktur überein, wo grundlegende Regeln visueller Gruppierung am deutlichsten sind. Das Modell sagte außerdem erfolgreich die geistige Beanspruchung voraus und lag korrekt bei der Vorhersage, welche Bilder als anspruchsvoller zu verarbeiten empfunden würden, insbesondere bei Maßen wie mentaler Beanspruchung und körperlicher Anstrengung. Blickbewegungsmuster aus den Aufmerksamkeitskarten des Modells ähnelten menschlichen Scanpfaden: Beide konzentrierten sich stärker auf visuell und ästhetisch wichtige Regionen, und das Timing der schnellen und langsamen Betrachtungsphasen spiegelte das Zwei‑Pfade‑Design wider. Gleichzeitig zeigte die Studie, dass kultureller Hintergrund, persönliche Assoziationen und Kunstausbildung viele der verbleibenden Abweichungen erklärten, was daran erinnert, dass Schönheit nie völlig universal ist.

Was das für unsere Begegnungen mit KI‑Kunst bedeutet

Für die allgemeine Leserschaft lautet die Kernbotschaft, dass es möglich ist, KI‑Systeme zu entwickeln, die Bilder auf Weisen beurteilen, die wir tatsächlich interpretieren können, statt ihnen blind zu vertrauen. Indem jeder Teil des Modells in psychologische Ideen über Aufmerksamkeit, Anstrengung, Präferenz und Emotion verankert ist, zeigt die Forschung, dass KI dazu beitragen kann zu erklären, wie wir Kunst erleben, selbst wenn unsere Reaktionen durch Kultur und persönliche Geschichte geprägt sind. Praktisch kann das Rahmenwerk Empfehlungssysteme, digitale Lernwerkzeuge und Ausstellungspräsentationen leiten, sodass sie menschliche Grenzen und Vorlieben respektieren. Zugleich betont die Arbeit, dass KI den menschlichen ästhetischen Urteil nicht ersetzen, sondern ergänzen sollte — sie dient als Linse auf unseren Geist und nicht als endgültige Autorität darüber, was als schön gilt.

Zitation: Jin, C. An AI-generated art evaluation model that integrates computational aesthetics and cognitive psychology. Sci Rep 16, 15309 (2026). https://doi.org/10.1038/s41598-026-42766-8

Schlüsselwörter: Kunst-KI, ästhetisches Urteil, kognitive Psychologie, Blickverfolgung, Bildbewertung