Clear Sky Science · de

Erzählkontext lenkt den Blick von visueller zu semantischer Auffälligkeit

2026-02-19 · Zurück zur Übersicht

Warum unsere Augen nicht nur dem Hellsten folgen

Wenn Sie ein Bild betrachten, springen Ihre Augen in schnellen Bewegungen umher und verweilen kurz auf verschiedenen Bereichen der Szene. Es erscheint vielleicht naheliegend, dass Ihr Blick von dem angezogen wird, was am buntesten oder am stärksten kontrastiert. Im Alltag folgen wir jedoch meist Geschichten — wir schauen einen Film, lesen Comics oder scrollen durch Fotos — und versuchen zu verstehen, was vor sich geht. Diese Studie stellt eine einfache, aber kraftvolle Frage: Während sich eine Geschichte entfaltet, hetzen unsere Augen weiterhin den auffälligsten Stellen nach, oder richten sie sich stärker auf die Teile, die für das Verstehen der Handlung am wichtigsten sind?

Betrachten wortloser Bildgeschichten

Die Forschenden baten Erwachsene, sich kurze, wortlose Bildgeschichten über einen Jungen und seine Tierfreunde anzusehen. Jede Geschichte bestand aus 24 handgezeichneten Bildern, die in ihrer Originalreihenfolge einen klaren Anfang, eine Mitte und ein Ende ergaben. Manchmal sahen die Teilnehmenden die Bilder in dieser richtigen Reihenfolge, sodass sich eine zusammenhängende Erzählung im Kopf aufbauen konnte. Andere Male wurden dieselben Bilder in zufälliger Reihenfolge gezeigt, wodurch die Handlung durcheinandergeriet, während der visuelle Inhalt identisch blieb. Währenddessen sollten die Personen die Bilder frei betrachten, während ihre Augenbewegungen mit hochpräzisem Tracking aufgezeichnet wurden.

Messung dessen, was visuell auffällt versus was bedeutungsvoll ist

Um zu verstehen, welche Aspekte eines Bildes die Augen anzogen, verglich das Team zwei sehr unterschiedliche Arten von „Wichtigkeit“. Erstens schätzten sie die visuelle Auffälligkeit — wie sehr ein Objekt allein aufgrund seiner Bildeigenschaften hervorsticht, etwa durch Kontrast und Kanten — mithilfe fortgeschrittener Computervisionsmodelle, die vorhersagen, wohin Menschen bei Einzelbildern blicken. Zweitens schätzten sie die semantische Auffälligkeit — wie wichtig ein Objekt für das Verständnis der Geschichte ist. Dazu verfassten separate Freiwillige kurze Erzählungen, die jede Bildsequenz in kohärenter Reihenfolge beschrieben. Ein großes Sprachmodell (ein modernes KI-System, das auf Text trainiert wurde) wurde dann verwendet, um zu berechnen, wie überraschend jedes Wort in diesen Erzählungen im gegebenen Kontext war, und diese Überraschungswerte wurden bestimmten Objekten auf den Bildern zugeordnet (zum Beispiel dem eifersüchtigen Frosch, der plötzlich einen anderen Frosch beißt).

Wie die Reihenfolge der Geschichte beeinflusst, wohin und wann wir schauen

Mit diesen Messgrößen untersuchten die Autorinnen und Autoren zwei Aspekte des Blicks: wie häufig jedes Objekt fixiert wurde und wie schnell es den ersten Blick anzog. Über alle Bedingungen hinweg wurden stark visuell auffällige Objekte, wenig überraschend, häufiger und früher betrachtet als andere Bildteile. Der entscheidende Befund zeigte sich jedoch beim Vergleich von kohärenter und zufälliger Reihenfolge. Wenn Bilder eine sinnvolle Abfolge bildeten, sahen Betrachter relativ häufiger semantisch wichtige Objekte — jene, die narrative Gewicht trugen — als wenn dieselben Bilder durcheinandergewürfelt waren. Außerdem wurden diese bedeutungsvollen Objekte innerhalb jeder fünfsekündigen Betrachtungsperiode tendenziell früher fixiert. Im Gegensatz dazu nahm der Vorteil der visuell auffälligen Objekte in kohärenten Geschichten nicht zu; wenn überhaupt, ließ ihre anfängliche Dominanz schneller nach, sobald eine sinnvolle Erzählung konstruiert werden konnte.

Zeitlicher Verlauf der Aufmerksamkeitsverlagerung

Die Studie verfolgte zudem, wie sich dieses Gleichgewicht über aufeinanderfolgende Augenbewegungen änderte. Die allerersten Fixationen nach dem Erscheinen jedes neuen Bildes wurden stark von visueller Auffälligkeit bestimmt, unabhängig vom Kontext: Die Augen schnitten zunächst zu den physisch hervorgehobenen Bereichen der Szene. Im weiteren Verlauf des Betrachtens, besonders nachdem mehrere Fixationen erfolgt waren, trat jedoch eine Divergenz zutage. In durcheinandergewürfelten Sequenzen bevorzugten die Menschen weiterhin visuell auffällige Regionen. In kohärenten Sequenzen verschoben sich ihre Blicke zunehmend zu semantisch wichtigen Objekten, die halfen, ihr internes Modell der sich entfaltenden Geschichte zu aktualisieren. Dieses Muster galt nicht nur für das einzelstehend sichtbarste Objekt, sondern über alle Objekte einer Szene hinweg: In kohärenten Geschichten sagte semantische Wichtigkeit besser voraus, wie oft und wie schnell Objekte fixiert wurden.

Was das darüber offenbart, wie wir Szenen verstehen

Diese Ergebnisse legen nahe, dass unsere Augen keine bloßen Sklaven von Helligkeit und Kontrast sind. Vielmehr dienen sie unserer Neugier und unserem Verständnis. Auf den ersten Blick nehmen wir die visuell lautesten Teile einer Szene wahr, aber innerhalb eines Bruchteils einer Sekunde beginnt unser inneres Gefühl für „Was passiert hier?“ den Blick zu den Teilen zu lenken, die für die Geschichte wichtig sind — selbst wenn diese Teile visuell unauffällig sind, wie eine unscheinbare Tür oder ein genervter Frosch. Indem die Studie Eye-Tracking, bildbasierte Modelle und sprachbasierte KI kombiniert, zeigt sie, dass Erzählkontext die Art und Weise, wie wir Bilder erkunden, umgestaltet. Im Alltag bedeutet das: Augenbewegungen bieten ein Fenster nicht nur dafür, was wir sehen, sondern auch für die unsichtbare Geschichte, die wir in unserem Kopf konstruieren.

Zitation: Berlot, E., Schmitt, LM., Huber-Huber, C. et al. Narrative context shifts gaze from visual to semantic salience. Commun Psychol 4, 59 (2026). https://doi.org/10.1038/s44271-026-00426-7

Schlüsselwörter: Augenbewegungen, visuelle Aufmerksamkeit, Wahrnehmung von Geschichten, semantische Auffälligkeit, Sprachmodelle