Clear Sky Science · de

Kontrolle der Einprägsamkeit von Gesichtsaufnahmen mit generativen Modellen

· Zurück zur Übersicht

Warum manche Gesichter in unserem Gedächtnis haften bleiben

Jeden Tag scrollen wir an unzähligen Gesichtern vorbei, doch nur wenige bleiben hängen. Werbeexperten, Lehrende, Künstler und sogar Strafverfolger interessieren sich dafür, welche Bilder Menschen behalten und welche sie vergessen. Diese Studie stellt eine überraschende Frage: Können wir ein Porträtbild gezielt auffälliger machen oder weniger einprägsam, ohne die gezeigte Person oder ein natürliches Aussehen zu verfälschen? Mithilfe leistungsfähiger Bildgeneratoren zeigen die Autorinnen und Autoren: Ja, größtenteils — und die Einprägsamkeit lässt sich kontrolliert steuern.

Figure 1. Wie KI Porträtfotos stärker oder weniger einprägsam machen kann, während sie natürlich und realistisch bleiben
Figure 1. Wie KI Porträtfotos stärker oder weniger einprägsam machen kann, während sie natürlich und realistisch bleiben

Ein neuer Weg, die Einprägsamkeit eines Gesichts zu justieren

Die Forschenden bauen auf jüngsten Fortschritten in generativer KI auf, insbesondere auf einem System namens StyleGAN, das sehr realistische Gesichter aus abstrakten numerischen Codes erzeugen kann. Jeder Code entspricht einem Gesicht. Indem sie eine große Sammlung synthetischer Gesichter erzeugen und mit tiefen Lernnetzwerken — sogenannten „Memorability Assessoren“ — bewerten, wie wahrscheinlich es ist, dass jedes Bild erinnert wird, erstellen sie eine Landkarte zwischen diesen verborgenen Codes und menschlichem Gedächtnis. Mithilfe eines einfachen statistischen Werkzeugs finden sie dann eine trennende Fläche in diesem verborgenen Raum, die einprägsamere von weniger einprägsamen Gesichtern unterscheidet. Verschiebt man den Code eines Gesichts in eine Richtung über diese Fläche, steigt die prognostizierte Einprägsamkeit; in die andere Richtung gesenkt, nimmt sie ab.

Aussehen verändern, ohne die Identität zu ändern

Um das auf reale Fotos anzuwenden, „invertieren“ die Autorinnen und Autoren zuerst ein echtes Bild in den StyleGAN‑Latentraum, also sie finden einen Code, der das ursprüngliche Gesicht rekonstruiert. Sobald dieser Code vorliegt, schieben sie ihn entlang der Einprägsamkeitsrichtung und generieren das Bild neu. Die resultierenden Gesichter gehören derselben Person, wirken nun aber eher einprägsam oder weniger einprägsam. Sorgfältige Tests zeigen, dass die Identität erhalten bleibt und die Realitätsnähe der Bilder nahe an der der unbearbeiteten Ausgaben liegt. Das Team entwickelt zudem eine feinere, mehrstufige Variante der Methode, die die Einprägsamkeit in mehreren kleinen Schritten anpasst statt in einem einzigen Sprung; diese schonendere Kontrolle hält die Identität noch stabiler.

Was sich tatsächlich ändert, wenn ein Gesicht einprägsamer wird

Beim Durchsehen von Tausenden bearbeiteten Gesichtern deckt die Studie auf, welche visuellen Details sich typischerweise verändern, wenn die Einprägsamkeit steigt. Einprägsamere Gesichter wirken oft etwas jünger, mit schlankerem Gesichtsaufbau, hellerem Teint, ausgeprägterem Make‑up oder Gesichtshaar und ernsteren Ausdrücken. Die Forschenden messen lokale Bildeigenschaften um Augen und Mund und finden kleine, aber verlässliche Zunahmen im Kontrast der Augenregion sowie in der Farbsättigung der Lippen, wenn die Einprägsamkeit erhöht wird. Eine einfache Erklärung über generelle Helligkeitsänderung schließen sie aus: Gleichmäßiges Aufhellen oder Abdunkeln verändert Einprägsamkeitswerte kaum im Vergleich zu den stärkeren, lokal fokussierten Änderungen ihrer Methode.

Figure 2. Wie eine Verschiebung entlang einer verborgenen visuellen Skala ein Gesicht von leicht vergesslich zu sehr einprägsam verändert
Figure 2. Wie eine Verschiebung entlang einer verborgenen visuellen Skala ein Gesicht von leicht vergesslich zu sehr einprägsam verändert

Über Gesichter hinaus: Alltagsgegenstände

Der Ansatz beschränkt sich nicht auf Menschen. Die Autorinnen und Autoren wenden dieselbe Idee auf Bilder von Katzen, Pferden, Autos und Kirchen an, die von anderen generativen Modellen erzeugt wurden. Auch hier finden sie eine Richtung im verborgenen Code‑Raum, die die prognostizierte Einprägsamkeit erhöht oder verringert. Bei Objekten beinhalten die sichtbaren Änderungen oft Zoom, Verschiebung der Perspektive oder Anpassungen von Hintergrund und Farbe, die das Motiv hervorheben. Das deutet darauf hin, dass sich die visuellen Hinweise zwischen Gesichtern und Objekten unterscheiden, das zugrundeliegende Prinzip aber ähnlich ist: Im Raum möglicher Bilder gibt es konsistente Richtungen, die sie erinnerungswürdiger oder vergesslicher machen.

Warum kontrollierte Einprägsamkeit wichtig ist

Kurz gesagt zeigt die Arbeit, dass Einprägsamkeit kein bloßes mysteriöses Nebenprodukt eines Bildes ist; sie lässt sich gezielt beeinflussen. Indem Computer lernen, Bilder entlang subtiler visueller Dimensionen zu verschieben, können sie Gesichter und Gegenstände erzeugen, die unser Gedächtnis wahrscheinlicher abspeichert — oder weniger wahrscheinlich. Das hat Anwendungspotenzial in der Bildung, wo Diagramme oder Illustrationen für bessere Erinnerungen optimiert werden könnten, sowie in Kommunikation und Design, wo wichtige Botschaften mit einprägsamen Bildern kombiniert werden könnten. Zugleich betonen die Autorinnen und Autoren die Notwendigkeit ethischer Schutzmaßnahmen, denn dieselben Werkzeuge, die Bildungsbilder wirksamer machen, könnten auch verwendet werden, um Aufmerksamkeit und Erinnerung in problematischen Weisen zu steuern, was sorgfältige Aufsicht erfordert.

Zitation: Younesi, M., Mohsenzadeh, Y. Controlling memorability of face images with generative models. Sci Rep 16, 15759 (2026). https://doi.org/10.1038/s41598-026-46581-z

Schlüsselwörter: Bild‑Einprägsamkeit, Gesichtsaufnahmen, generative Modelle, StyleGAN, Latentraum‑Bearbeitung