Clear Sky Science · ru
Нарративный контекст смещает взгляд от визуальной к семантической заметности
Почему наши глаза не только следуют за самым ярким
Когда вы смотрите на картинку, ваши глаза скачут по сцене быстрыми движениями, кратко останавливаясь на разных ее частях. Может показаться очевидным, что взгляд притягивается к самому красочному или контрастному объекту. Но в повседневной жизни мы чаще следим за историями — смотрим фильм, читаем комиксы, пролистываем фотографии — и пытаемся понять, что происходит. В этом исследовании задают простой, но мощный вопрос: по мере развития сюжета наши глаза продолжают гнаться за самыми эффектными деталями или же смещаются к тем частям, которые важны для понимания повествования?

Наблюдение за бессловесными сюжетными картинками
Исследователи пригласили взрослых посмотреть короткие бессловесные истории в картинках о мальчике и его животных друзьях. Каждая история состояла из 24 нарисованных от руки изображений, которые в исходном порядке образовывали четкое начало, середину и конец. Иногда участники видели картинки в этом правильном порядке, так что в их умах формировалась связная история. В другие моменты те же самые изображения перемешивали в случайном порядке, нарушая сюжет при сохранении визуального содержимого. На протяжении всего эксперимента людей просто просили свободно смотреть на картинки, а их движения глаз записывались с помощью высокоточного трекинга.
Измерение того, что визуально выделяется, и того, что важно по смыслу
Чтобы понять, какие аспекты каждого изображения притягивали взгляд, команда сравнила два разных вида «важности». Во‑первых, они оценивали визуальную заметность — насколько объект выделяется исключительно из‑за свойств изображения, таких как контраст и края — с помощью современных моделей компьютерного зрения, предсказывающих, куда люди склонны смотреть на одиночной картинке. Во‑вторых, они оценивали семантическую заметность — насколько объект важен для понимания истории. Для этого отдельные добровольцы писали короткие рассказы, описывающие последовательность картинок в связном порядке. Затем крупная языковая модель (современная ИИ‑система, натренированная на тексте) использовалась для вычисления того, насколько «удивительным» было каждое слово в этих рассказах с учетом предшествующего контекста, и эти показатели неожиданности сопоставлялись с конкретными объектами на картинках (например, ревнивой лягушкой, которая внезапно кусает другую лягушку).
Как порядок истории меняет то, куда и когда мы смотрим
Имея эти меры, авторы проанализировали два аспекта взгляда: как часто на объект фиксировали взгляд и как быстро он привлекал первый взгляд. Во всех условиях объекты с высокой визуальной заметностью, что неудивительно, смотрели чаще и раньше, чем другие части изображения. Но ключевой результат проявился при сравнении связного и перемешанного порядка картинок. Когда изображения образовывали осмысленную последовательность, зрители в относительном выражении больше смотрели на семантически важные объекты — те, которые несли нарративную нагрузку — чем тогда, когда те же самые кадры были перемешаны. Кроме того, в каждом пятсекундном периоде они чаще обращали взгляд на эти значимые объекты раньше. Напротив, преимущество визуально эффектных объектов не увеличивалось в связных историях; если что, их раннее доминирование исчезало быстрее, когда можно было построить понятный сюжет.
Временная динамика смещения внимания
Исследование также отслеживало, как это соотношение менялось по мере последовательных фиксаций. Первые пара фиксаций после появления каждого нового изображения во многом определялись визуальной заметностью, независимо от контекста: глаза сначала устремлялись к физически заметным частям сцены. Но по мере продолжения просмотра, особенно после нескольких фиксаций, появлялось расхождение. В перемешанных последовательностях люди продолжали отдавать предпочтение визуально заметным регионам. В связных последовательностях их взгляд все сильнее смещался к семантически важным объектам, которые помогали обновлять внутреннюю модель разворачивающейся истории. Эта картина проявлялась не только для единственного самого заметного объекта, но и для всех объектов на сцене: в связных историях семантическая важность лучше предсказывала и частоту, и скорость фиксаций объектов.

Что это говорит о нашем понимании сцен
Эти результаты показывают, что наши глаза не являются просто рабами яркости и контраста. Они служат нашему любопытству и пониманию. Сначала мы пробно смотрим на визуально «громкие» части сцены, но в доли секунды наше внутреннее ощущение «что здесь происходит?» начинает направлять взгляд к тем элементам, которые важны для истории — даже если эти элементы визуально неприметны, как невзрачная дверь или раздраженная лягушка. Сочетая трекинг глаз, модели, основанные на изображениях, и языковые ИИ, исследование демонстрирует, что нарративный контекст перестраивает то, как мы исследуем картинки. В повседневной жизни это означает, что движения глаз дают окно не только в то, что мы видим, но и в невидимую историю, которую мы строим в уме.
Цитирование: Berlot, E., Schmitt, LM., Huber-Huber, C. et al. Narrative context shifts gaze from visual to semantic salience. Commun Psychol 4, 59 (2026). https://doi.org/10.1038/s44271-026-00426-7
Ключевые слова: движения глаз, визуальное внимание, восприятие истории, семантическая заметность, языковые модели