Clear Sky Science · pl

Dane referencyjne ruchu oczu do klasyfikacji śledzenia płynnego

· Powrót do spisu

Dlaczego śledzenie wzroku ma znaczenie

Za każdym razem, gdy czytasz zdanie, oglądasz mecz piłki nożnej lub śledzisz świetlika w ciemności, twoje oczy wykonują skomplikowany taniec szybkich przeskoków i płynnych przejść. Te drobne ruchy ujawniają, na co zwracamy uwagę i jak działa nasz mózg — coraz częściej są też wykorzystywane do badania urazów mózgu czy demencji. Komputery analizujące dane ze śledzenia wzroku wciąż jednak mają trudność z rozróżnieniem dwóch kluczowych typów ruchów: nieruchomego patrzenia na statyczny obiekt i płynnego podążania za poruszającym się celem. Artykuł przedstawia starannie zaprojektowany zbiór danych, który ma pomóc badaczom w trenowaniu i testowaniu lepszych metod komputerowych do rozróżniania tych ruchów.

Problem odczytywania ruchów oczu

Urządzenia śledzące wzrok rejestrują, dokąd skierowane są nasze oczy, tysiące razy na sekundę, ale przekształcenie tych strumieni liczb w sensowne zdarzenia bywa trudne. Występują szybkie przeskoki (sakady), stałe spojrzenia w jedno miejsce (fiksacje) oraz płynne podążanie za ruchomym obiektem (śledzenia płynne). Fiksacje i śledzenia płynne w surowych danych wyglądają zaskakująco podobnie, ponieważ w obu przypadkach oko porusza się powoli z jednego punktu do drugiego. Eksperci często się nie zgadzają, co do ich rozróżnienia, a wiele algorytmów komputerowych również je myli. To szczególnie problematyczne, ponieważ wydajność śledzenia płynnego jest ważną wskazówką w diagnozowaniu i zrozumieniu zaburzeń takich jak schizofrenia, urazy mózgu czy choroby neurodegeneracyjne.

Projektowanie czystych, kontrolowanych ruchów oczu

Aby sprostać temu problemowi, autorzy stworzyli wysoce kontrolowany eksperyment zamiast polegać na hałaśliwych scenach rzeczywistych. Dziesięciu studentów uniwersytetu siedziało z ustabilizowaną głową w podpórce pod podbródek, patrząc na ekran, podczas gdy pojedyncze, małe szare kółko poruszało się na czarnym tle w różny sposób. Badacze zaprojektowali trzy proste „zachowania” tego kółka: poruszające się kółko płynnie sunące po ekranie, przeskakujące kółko przeskakujące między stałymi punktami oraz kółko poruszające się tam i z powrotem, które płynnie sunie, a następnie wraca skokiem na początek. Każde zadanie zostało skonstruowane tak, by w danym przebiegu występował tylko jeden rodzaj wolnego ruchu (fiksacja lub śledzenie płynne), wraz z szybkimi przeskokami. Takie sprytne ustawienie sprawia, że długie, wolne odcinki są niemal na pewno albo czystym patrzeniem, albo czystym śledzeniem, bez ich mieszania.

Figure 1
Figure 1.

Dokładne pomiary i wysokiej jakości dane

Zespół użył szybkiego urządzenia śledzącego wzrok, które rejestrowało pozycję prawego oka 1000 razy na sekundę, podczas gdy ekran odświeżał się 144 razy na sekundę. Cele poruszały się w ośmiu prostych kierunkach (góra, dół, lewo, prawo i cztery przekątne) oraz trzema prędkościami reprezentującymi powolne, średnie i szybkie śledzenie. Każdy uczestnik wykonał 144 krótkie próby, co łącznie daje około 24 minut danych na osobę i niemal cztery godziny w sumie. Badacze wielokrotnie kalibrowali urządzenie, sprawdzali, jak dobrze zarejestrowany kierunek spojrzenia pokrywa się z celami, oraz monitorowali, jak często brak danych wynikał z mrugnięć lub utraty śledzenia. Poza wyraźnie zidentyfikowanym zestawem prób z niedopasowaniem dla jednego uczestnika, te kontrole wykazały, że pozycja oka i celów dobrze się pokrywały, a fiksacje były stabilne i precyzyjne.

Od surowych śladów do użytecznych etykiet

Zamiast prosić ludzi o ręczne oznaczanie każdego momentu danych, autorzy wykorzystali strukturę eksperymentu do automatycznego etykietowania. Najpierw oczyścili surowe pliki, usunęli mrugnięcia i przekształcili pozycje na ekranie w kąty widzenia, które lepiej odzwierciedlają ruch oka. Następnie dla każdej próby obliczyli, jak szybko zmieniała się pozycja oka w czasie i zbudowali niestandardowy próg prędkości. Ruchy wolniejsze od tego progu traktowano jako zdarzenia „wolne” (fiksacje lub śledzenia, zależnie od typu próby), a szybsze wybuchy jako przeskoki. Bardzo krótkie zdarzenia, krótsze niż około jedna setna sekundy, zostały przemianowane, aby uniknąć liczenia drobnych zakłóceń jako istotnych ruchów oczu. To wygenerowało to, co autorzy nazywają „prawdopodobnymi etykietami referencyjnymi” dla fiksacji, sakad i śledzeń płynnych, osadzonymi zarówno w projekcie eksperymentu, jak i w mierzonej prędkości oka.

Figure 2
Figure 2.

Narzędzia dla społeczności badawczej

Aby uczynić zbiór danych szeroko użytecznym, autorzy umieścili wszystkie pliki na otwartej platformie internetowej i udostępnili towarzyszące oprogramowanie w Pythonie. Badacze mogą pobrać surowe nagrania, wersje oczyszczone, informacje o każdym uczestniku oraz dokładne ścieżki celu. Pakiet towarzyszący zawiera gotowe funkcje do pobierania, wstępnego przetwarzania i etykietowania danych oraz narzędzia do rysowania wykresów do wizualizacji prób. Ponieważ kod eksperymentu jest również dostępny, inne laboratoria mogą odtworzyć to samo zadanie i rozszerzyć zbiór danych lub badać nowe sposoby włączania informacji o tym, gdzie powinien znajdować się cel, do swoich algorytmów.

Co to oznacza dla przyszłości śledzenia wzroku

Dla czytelnika nietechnicznego kluczowa wiadomość jest taka, że ta praca dostarcza czystego pola testowego do uczenia komputerów rozpoznawania różnych rodzajów ruchów oczu, zwłaszcza subtelnego działania polegającego na płynnym śledzeniu ruchu. Dzięki zapobieganiu nakładaniu się najbardziej mylących ruchów w tej samej próbie oraz poleganiu na wyraźnych różnicach prędkości zamiast zawodnych ocen ludzkich, autorzy oferują solidny zestaw odniesienia, na którym inni mogą budować. Z biegiem czasu lepsze algorytmy trenowane na takich danych mogą uczynić śledzenie wzroku bardziej wiarygodnym narzędziem w psychologii, neuronauce i diagnostyce medycznej, pomagając klinicystom i badaczom lepiej rozumieć, jak nasze oczy odzwierciedlają pracę mózgu.

Cytowanie: Korthals, L., Visser, I. & Kucharský, Š. Eye movement benchmark data for smooth-pursuit classification. Sci Data 13, 375 (2026). https://doi.org/10.1038/s41597-026-06963-4

Słowa kluczowe: śledzenie wzroku, śledzenie płynne, sakady, zbiór danych referencyjnych, klasyfikacja spojrzeń