Clear Sky Science · ru

Факторы разрешения визуальной неоднозначности

2026-03-17 · Назад к списку

Загадка в повседневном зрении

Случалось ли вам смотреть на размытое черно-белое изображение, которое вдруг «вспыхивает» и превращается в отчетливый объект, как только вам говорят, что на нем изображено? Это исследование погружается в эту повседневную магию. Авторы задаются вопросом, почему одни расплывчатые картинки остаются упрямо непонятными, в то время как другие мгновенно обретают смысл, и что именно меняется в наших мозгах, когда мы, наконец, «понимаем», что видим.

Преобразование четких снимков в визуальные загадки

Чтобы изучить эти вопросы, команда создала огромную коллекцию визуальных загадок. Они взяли 1 854 фотографии привычных объектов — от птиц и инструментов до фруктов и транспортных средств — и превратили их в резкие черно-белые «изображения Муни». Эти картинки сохраняют лишь крупные участки тьмы и света, лишая изображение тонких деталей и оттенков. Более 900 добровольцев просматривали эти снимки в режиме онлайн. Для каждого изображения люди сначала сообщали, узнали ли они объект, а затем выбирали его название из списка. Важный момент: каждое двусмысленное изображение показывали дважды — до и после того, как участники ненадолго видели исходную, четкую серую версию между показами. Это позволило исследователям проследить, как меняется восприятие по мере того, как люди получают дополнительную информацию.

Почему некоторые картинки так трудно увидеть?

Чтобы понять, почему одни изображения кажутся более неоднозначными, исследователи обратились к искусственной нейронной сети, вдохновленной работой зрительной системы мозга человека. Они сравнили, насколько похожими модель считала каждое четкое изображение и его версию Муни на разных этапах обработки — от простого обнаружения краев до сложного распознавания объектов. Оказалось, что преобразование в стиль Муни главным образом повреждало высокоуровневые этапы, несущие информацию о том, что представляет собой объект, тогда как низкоуровневые признаки, такие как контуры и грубая форма, относительно сохранялись. Изображения, которые сохраняли больше таких высокоуровневых признаков, люди узнавали легче. Иными словами, причина путаницы заключается не столько в утрате сырых деталей, сколько в потере абстрактной структуры, сигнализирующей «это собака» или «это стул».

Как обучение меняет то, как мы смотрим

Показ четкой версии изображения — «разъяснение» — имел сильный эффект. После этого люди начали быстрее и увереннее сообщать о распознавании изображения Муни, и они гораздо чаще называли его правильно. Но и значимость признаков сместилась. До разъяснения распознавание сильно зависело от сохранения высокоуровневых, «объектоподобных» паттернов. После разъяснения в большей степени стали играть роль низкоуровневые визуальные признаки — формы и контуры. Как будто, увидев ответ, люди начали сопоставлять черно-белые пятна Муни с недавно сформированным внутренним шаблоном из четкой версии, опираясь на более детальную структуру картинки, а не на расплывчатые предположения.

От диких догадок к общему значению

Команда также проанализировала слова, которыми люди называли каждый объект. Они измеряли, насколько «далеко» каждая метка находилась от истинного значения объекта в семантическом пространстве, построенном на языковых данных, и насколько варьировались ответы людей для одной и той же картинки. До разъяснения догадки были разбросаны и непоследовательны: одни ответы были слабо связаны с истинным объектом («лошадь» вместо «зебры»), другие — совершенно неверны. После просмотра четкой версии метки участников становились ближе по смыслу к истинному объекту и более согласованными между собой. Интересно, что количество полученной информации не улучшало распознавание по простой линейной шкале. Напротив, наблюдалась U-образная зависимость: наилучшие результаты были либо когда новая информация сильно подтверждала то, что человек уже предполагал, либо когда она явно опровергала ошибочное предположение. Умеренные, неоднозначные коррекции оказывались менее полезны.

Как наш ум укрощает визуальную путаницу

Эта работа показывает, что мы разрешаем визуальную неоднозначность через гибкий танец между широкими догадками и точным сопоставлением. Сначала мозг опирается на высокоуровневые ожидания: мы пытаемся вписать смутные формы в знакомые объекты. Как только нам показывают ответ, мы переключаемся на проверку точного расположения краев и пятен на соответствие объекту, который теперь «знаем». Одновременно наше ментальное описание объекта становится и острее, и более общим среди людей. Вывод о том, что больше информации не всегда лучше, и что явное подтверждение или явное опровержение могут быть наиболее полезны, даёт более полное представление о том, как мы извлекаем смысл из фрагментарных изображений — процессе, лежащем в основе нашего восприятия в беспорядочном, неоднозначном реальном мире.

Цитирование: Linde-Domingo, J., Ortiz-Tudela, J., Völler, J. et al. Determinants of visual ambiguity resolution. Commun Psychol 4, 78 (2026). https://doi.org/10.1038/s44271-026-00441-8

Ключевые слова: зрительное восприятие, неоднозначность, распознавание объектов, предиктивная обработка, изображения Муни