Clear Sky Science · pl

Determinanty rozwiązywania niejednoznaczności wzrokowej

· Powrót do spisu

Tajemnica w codziennym widzeniu

Czy kiedykolwiek wpatrywałeś się w rozmyte czarno-białe zdjęcie, które nagle „wychodzi” jako wyraźny obiekt, gdy ktoś podpowie, co to jest? To badanie zgłębia tę codzienną magię. Naukowcy pytają, dlaczego niektóre rozmyte obrazy pozostają uporczywie mylące, podczas gdy inne nagle układają się w wyraźny kształt w naszym umyśle, oraz co dokładnie zmienia się w mózgu, gdy w końcu „zrozumiemy”, co widzimy.

Figure 1
Figure 1.

Przekształcanie wyraźnych obrazów w wizualne zagadki

Aby zbadać te pytania, zespół stworzył ogromny zbiór wizualnych zagadek. Zaczęli od 1 854 zdjęć codziennych przedmiotów — od ptaków i narzędzi po owoce i pojazdy — i przerobili je na surowe czarno-białe obrazy typu Mooney. Te obrazy zachowują tylko szerokie plamy ciemności i jasności, pozbawiając ilustracje drobnych szczegółów i cieniowania. Ponad 900 ochotników oglądało te obrazy online. Dla każdego zdjęcia osoby najpierw stwierdzały, czy potrafią zidentyfikować obiekt, a następnie wybierały jego nazwę z listy. Co istotne, każdy niejednoznaczny obraz pokazywano dwukrotnie: raz przed i raz po tym, jak uczestnicy krótko zobaczyli oryginalną, wyraźną szarą wersję pomiędzy prezentacjami. To pozwoliło badaczom obserwować, jak zmienia się percepcja w miarę uzyskiwania dodatkowych informacji.

Co sprawia, że obraz jest trudny do odczytania?

Aby zrozumieć, dlaczego niektóre obrazy wydają się bardziej niejednoznaczne od innych, badacze sięgnęli po inspirowaną mózgiem sztuczną sieć neuronową, która naśladuje etapy przetwarzania wzrokowego w ludzkim mózgu. Porównywali, jak podobne dla tego modelu były wyraźne obrazy i ich odpowiedniki Mooney’a na różnych etapach — od prostego wykrywania krawędzi po złożone rozpoznawanie obiektów. Okazało się, że transformacja Mooney’a w dużej mierze uszkadzała wyższe poziomy przetwarzania, które niosą informacje o tym, czym jest obiekt, podczas gdy niższopoziomowe cechy, takie jak krawędzie i ogólny kształt, były stosunkowo zachowane. Obrazy, które zachowywały więcej z tych wyższych cech, były łatwiejsze do rozpoznania. Innymi słowy, to, co czyni obraz mylącym, to mniej utrata surowych detali, a bardziej utrata abstrakcyjnej struktury sygnalizującej „to jest pies” lub „to jest krzesło”.

Jak uczenie zmienia sposób, w jaki patrzymy

Obejrzenie wyraźnej wersji obrazu — „odejmowanie niejednoznaczności” — miało silny efekt. Potem ludzie szybciej i pewniej mówili, że rozpoznają obraz Mooney’a, i znacznie częściej nazywali go poprawnie. Jednak znaczenie poszczególnych cech także się zmieniło. Przed odejmowaniem niejednoznaczności rozpoznawanie silnie zależało od tego, czy obraz zachowywał te wyższe, przypominające obiekty wzory. Po nim to niższe cechy wizualne, takie jak kształty i kontury, odgrywały większą rolę. To tak, jakby po zobaczeniu odpowiedzi ludzie zaczęli dopasowywać plamy czerni i bieli w obrazie Mooney’a do nowo utworzonego wewnętrznego szablonu z wyraźnego obrazu, używając drobniejszej struktury obrazu zamiast polegać na luźnych wrażeniach.

Figure 2
Figure 2.

Od dzikich zgadywanek do wspólnego znaczenia

Zespół przyjrzał się też słowom, których ludzie używali do nazywania poszczególnych obiektów. Mierzyli, jak „daleko” każda etykieta była od prawdziwego znaczenia obiektu w przestrzeni semantycznej zbudowanej na danych językowych oraz jak zróżnicowane były odpowiedzi różnych osób dla tego samego obrazu. Przed odejmowaniem niejednoznaczności odpowiedzi były rozproszone i niespójne: niektóre odpowiedzi były luźno powiązane („koń” zamiast „zebra”), inne były zupełnie nietrafione. Po obejrzeniu wyraźnego obrazu etykiety przesunęły się bliżej znaczenia prawdziwego obiektu i stały się bardziej podobne między sobą. Co ciekawe, ilość informacji uzyskana z wyraźnego obrazu nie poprawiała rozpoznania w prosty liniowy sposób. Zamiast tego pojawił się wzorzec w kształcie litery U: ludzie radzili sobie najlepiej, gdy nowe informacje albo mocno potwierdzały to, czego już podejrzewali, albo wyraźnie obalały błędne przypuszczenie. Umiarkowane, niejednoznaczne korekty były mniej pomocne.

Jak nasz umysł ujarzmia wzrokowe zamieszanie

Ta praca sugeruje, że rozwiązujemy wzrokowe niejasności poprzez elastyczny taniec między szerokimi przypuszczeniami a precyzyjnym dopasowaniem. Na początku nasz mózg opiera się na wysokopoziomowych oczekiwaniach: próbujemy dopasować nieostre kształty do znanych obiektów. Gdy zobaczymy odpowiedź, przechodzimy do sprawdzania, czy dokładne ułożenie krawędzi i plam pasuje do obiektu, który teraz „wiemy”, że tam jest. Jednocześnie nasz mentalny opis obiektu staje się zarówno ostrzejszy, jak i bardziej powszechny wśród ludzi. Odkrycie, że więcej informacji nie zawsze jest lepsze, oraz że wyraźne potwierdzenie lub wyraźne obalenie mogą być najbardziej pomocne, daje bogatszy obraz tego, jak wydobywamy znaczenie z niepełnych widoków — procesu leżącego u podstaw tego, jak widzimy w nieporządnym, niejednoznacznym świecie rzeczywistym.

Cytowanie: Linde-Domingo, J., Ortiz-Tudela, J., Völler, J. et al. Determinants of visual ambiguity resolution. Commun Psychol 4, 78 (2026). https://doi.org/10.1038/s44271-026-00441-8

Słowa kluczowe: percepcja wzrokowa, niejednoznaczność, rozpoznawanie obiektów, przetwarzanie predykcyjne, obrazy Mooney’a