Clear Sky Science · pl

Poziomy wychył sakad wynika z połączenia anizotropii saliencyjności i egocentrycznych uprzedzeń

· Powrót do spisu

Jak nasze oczy skanują świat

Za każdym razem, gdy rozglądasz się po pomieszczeniu, czytasz znak albo obserwujesz przejeżdżający samochód, twoje oczy wykonują szybkie przeskoki zwane sakadami. Te niewielkie, szybkie ruchy pomagają sklejać obraz, który widzimy. Jednak te przeskoki nie są równomiernie rozłożone we wszystkich kierunkach: ludzie poruszają oczami w lewo i w prawo znacznie częściej niż w górę i w dół. W tym badaniu pada pozornie proste pytanie o daleko idących implikacjach dla nauki o wzroku, robotyki czy rzeczywistości wirtualnej: dlaczego nasze ruchy oczu są tak silnie zorientowane poziomo?

Wzory na obrazach i w naszym spojrzeniu

Aby zbadać to pytanie, badacze przeanalizowali zapisy ruchów oczu 48 osób, które swobodnie oglądały 141 naturalnych obrazów, w tym ulice miast, krajobrazy i zbliżenia obiektów. Potwierdzili dobrze znany wzorzec: gdy ludzie patrzą na obrazy, ich sakady mają tendencję do podążania głównymi kierunkami kompasu, szczególnie poziomymi. Jednak ten poziomy priorytet nie był taki sam dla każdego obrazu. Niektóre obrazy, na przykład gęste skupisko liści, wywoływały tylko słabe preferencje lewo–prawo, podczas gdy inne, jak szeroka scena z wyraźnym horyzontem i rzędami drzew, powodowały bardzo silne poziome ruchy oczu. Ta zmienność sugerowała, że coś w samych obrazach kształtuje sposób, w jaki poruszają się oczy.

Figure 1
Figure 1.

Trzy sposoby mierzenia tego, co się wyróżnia

Zespół poszukał następnie konkretnych cech obrazu, które mogłyby przewidzieć, jak silnie widzowie będą faworyzować ruchy poziome. Przetestowali trzy kandydatury. Po pierwsze, zmierzyli podstawowy wzór jasności i ciemności w różnych orientacjach, używając techniki powiązanej z transformatą Fouriera, aby sprawdzić, czy obraz ma więcej poziomych czy pionowych prążków. Po drugie, użyli nowoczesnego modelu komputerowego saliencyjności wzrokowej, który szacuje, gdzie ludzie najprawdopodobniej patrzą w scenie. Z tych map saliencyjności zasymulowali tysiące przeskoków oczu, aby wywnioskować, czy model „preferuje” ruchy poziome. Po trzecie, wykorzystali sieć neuronową wytrenowaną do zgadywania orientacji obrazu względem grawitacji, co uchwyciło bardziej globalne wskazówki strukturalne, takie jak to, czy budynki i horyzonty są wyrównane. Dla każdego obrazu sprowadzili te trzy analizy do jednej liczby opisującej, na ile każda cecha była zorientowana poziomo.

Znaczący wpływ ma wyróżniająca się struktura

Gdy badacze porównali te miary obrazu z rzeczywistymi danymi o ruchach oczu, jeden czynnik wyróżniał się wyraźnie: uprzedzenia orientacji w mapach saliencyjności. Obrazy, w których model saliencyjności przewidywał, że najbardziej przyciągające uwagę regiony układają się bardziej poziomo, również wywoływały silniejsze poziome sakady u ludzkich widzów. W kontraście, surowy wzorzec jasno–ciemnych prążków i globalna wskazówka strukturalna nie przewidywały istotnie poziomego uprzedzenia ruchów oczu. Modele statystyczne wykazały, że orientacja związana z saliencyjnością wyjaśniała zauważalną część różnic między obrazami, w dwóch bardzo różnych zbiorach obrazów. Innymi słowy, nie chodzi tylko o to, że świat ma wiele poziomych i pionowych linii; najważniejsze jest to, jak te linie organizują konkretne miejsca przyciągające nasze spojrzenie.

Łączenie preferencji związanych z ciałem i światem

Jednak sama saliencyjność nie potrafiła w pełni wyjaśnić, jak ludzie poruszają oczami. Poprzednie eksperymenty wykazały, że nawet gdy scena jest obrócona lub gdy ludzie siedzą z odchyloną głową, ich ruchy oczu są częściowo pociągane przez orientację sceny, a częściowo przez orientację ciała i oczu. Aby uchwycić tę równowagę, autorzy zbudowali model obliczeniowy mieszający dwa składniki: mapę allocentryczną (związaną ze sceną, wykorzystując przewidywania saliencyjności) oraz mapę egocentryczną (związaną z obserwatorem, z wbudowaną preferencją dla poziomych sakad wokół środka spojrzenia). Model następnie symulował sekwencje sakad, łącząc te mapy. Dla obrazów ustawionych pionowo, model mieszany wygenerował wzorce ruchów oczu, które blisko przypominały dane ludzkie, lepiej niż model opierający się wyłącznie na scenie lub wyłącznie na wewnętrznym uprzedzeniu.

Figure 2
Figure 2.

Gdy sceny się przechylają, duże i małe przeskoki się rozchodzą

Prawdziwy test nastąpił, gdy badacze zastosowali swój model do obróconych wersji tych samych scen. U ludzkich obserwatorów rozkład kierunków sakad częściowo obraca się w kierunku przechylenia obrazu, a duże sakady podążają za obróconą sceną bardziej niż małe, które pozostają bardziej związane z własnym poczuciem „poziomu”. Model kombinowany odtworzył ten wzorzec w poprawnym kierunku: jego symulowane sakady obracały się w stronę przechylonej sceny, a większe symulowane przeskoki wykazywały większy obrót niż mniejsze. Jednak wielkość obrotu była mniejsza niż u ludzi. Ta rozbieżność sugeruje, że obecne modele saliencyjności nie uchwyciły jeszcze wszystkich sposobów, w jakie przechylone sceny przyciągają nasze oczy, oraz że sposób, w jaki mózg miesza informacje związane z ciałem i ze światem, jest bardziej elastyczny niż zakłada model.

Dlaczego to ma znaczenie dla zrozumienia widzenia

Dla laika kluczowe wnioski są takie, że nasza preferencja patrzenia w lewo i prawo nie jest dziwactwem ani usterką; odzwierciedla współdziałanie dwóch sił. Jedna jest wbudowana w sam system ruchów oczu i sprzyja poziomym przeskokom nawet w ciemności. Druga pochodzi ze struktury świata, w którym żyjemy — horyzonty, płaszczyzny gruntu, budynki i wiele obiektów układają się wzdłuż osi poziomych i pionowych i kształtują, które części sceny się wyróżniają. Badanie to pokazuje, że mózg prawdopodobnie wyewoluował egocentryczne poziome uprzedzenie, ponieważ odpowiada ono statystykom scen naturalnych, które zwykle napotykamy będąc w pozycji pionowej. Zrozumienie tej współzależności nie tylko wyjaśnia, jak widzimy, lecz także daje wskazówki, jak budować bardziej ludzkie systemy widzenia komputerowego i projektować środowiska wizualne, które współgrają, a nie stoją w sprzeczności, z naturalnymi tendencjami naszych oczu.

Cytowanie: Reeves, S.M., Otero-Millan, J. Horizontal saccade bias results from combination of saliency anisotropies and egocentric biases. Sci Rep 16, 6027 (2026). https://doi.org/10.1038/s41598-026-35572-9

Słowa kluczowe: ruchy oczu, uwaga wzrokowa, sceny naturalne, modele saliencyjności, sakady