Clear Sky Science · pl

Cuentos: Duży korpus śledzenia wzroku podczas czytania tekstów narracyjnych po hiszpańsku

· Powrót do spisu

Dlaczego obserwacja oczu ujawnia, jak czytamy

Za każdym razem, gdy czytasz opowiadanie, twoje oczy skaczą, zatrzymują się i przeskakują w sposób, którego prawie nie zauważasz — a te drobne ruchy cicho pokazują, jak pracuje twój umysł. Większość wiedzy w tej dziedzinie pochodzi z badań prowadzonych w języku angielskim. Artykuł przedstawia „Cuentos”, największy publiczny zbiór danych o ruchach oczu zarejestrowanych podczas czytania pełnych opowiadań po hiszpańsku. Zamienia niewidoczny taniec oczu w bogate źródło wiedzy o tym, jak czytają hiszpańskojęzyczni czytelnicy, i w materiał do budowania lepszych technologii językowych.

Opowiadania, a nie izolowane zdania

Zamiast używać krótkich, sztucznych zdań, badacze poprosili 113 rodzimych użytkowników języka hiszpańskiego o przeczytanie kompletnych, samodzielnych opowiadań napisanych po hiszpańsku używanym w Ameryce Łacińskiej. Zbiór obejmuje 30 różnych utworów — niektóre dłuższe, inne krótsze — w gatunkach takich jak realizm, horror, eseje i publicystyka naukowa. Średnio długie opowiadania mają około 3300 słów, a krótkie około 800, łącznie obejmując niemal 40 000 słów i 8500 różnych wyrazów. Taki projekt oddaje naturalny sposób czytania tekstów narracyjnych od początku do końca, zamiast badania przetwarzania pojedynczych linii w warunkach laboratoryjnych.

Figure 1
Figure 1.

Śledzenie każdego zatrzymania wzroku

Uczestnicy siedzieli w przyciemnionym pomieszczeniu i czytali teksty na ekranie komputera, podczas gdy szybkookresowy rejestrator ruchu oczu zapisywał, gdzie patrzyli tysiąc razy na sekundę. Urządzenie zarejestrowało dwa kluczowe zachowania: krótkie zatrzymania zwane fiksacjami, gdy oczy zbierają informacje z strony, oraz szybkie przeskoki zwane sakkadami, gdy oczy przemieszczają się w nowe miejsce. Teksty były podzielone na wiele ekranów, a czytelnicy mogli swobodnie poruszać się w przód i w tył za pomocą klawiszy strzałek, tak jak ktoś przewraca strony. Po każdym opowiadaniu odpowiadali na pytania sprawdzające zrozumienie, aby upewnić się, że zwracali uwagę, a przy krótkich tekstach wykonywali też krótkie zadanie skojarzeń słownych, by zresetować fokus przed kolejną historią.

Przekształcanie surowych ścieżek wzroku w uporządkowane dane

Zbieranie surowych punktów śledzenia wzroku to dopiero początek. Zespół opracował własne oprogramowanie do starannego czyszczenia i organizacji tych informacji. Usunęli niewiarygodne dane, takie jak ekstremalnie krótkie lub bardzo długie fiksacje oraz próby, w których urządzenie było źle skalibrowane. Dla każdego ekranu ludzie-kontrolerzy dopasowywali linie pomocnicze tak, aby skupiska fiksacji idealnie pokrywały się z właściwą linią tekstu. Następnie, wykorzystując położenie spacji między wyrazami, przypisywali pojedyncze fiksacje do konkretnych słów. Wykrywano i filtrowano przypadki szczególne — na przykład duży przeskok wzroku z końca jednej linii na początek następnej czy przypadkowe powroty do wcześniejszych ekranów. Efektem jest drobiazgowo skuratowana mapa łącząca każde słowo w opowiadaniach z tym, jak długo, jak często i w jakim wzorze było oglądane.

Co ujawniają ruchy oczu

Z tych oczyszczonych śladów autorzy obliczyli bogaty zestaw miar dla każdego słowa. Niektóre odzwierciedlają wczesne, automatyczne przetwarzanie, takie jak długość pierwszej fiksacji czy czas patrzenia na słowo przed przejściem dalej. Inne pokazują późniejsze, bardziej świadome przetwarzanie, na przykład czas poświęcony na powroty do wcześniejszych wyrazów w celu ponownego przeczytania. Korzystając z nowoczesnych modeli statystycznych, potwierdzili dobrze znane wzorce obserwowane w innych językach, teraz jasno widoczne po hiszpańsku: krótsze i częściej występujące słowa czyta się szybciej, a bardzo krótkie, znajome słowa są częściej pomijane. Pozycja słowa w zdaniu lub na ekranie również subtelnie wpływa na to, jak długo oczy na nim przebywają. Te kontrole pokazują, że nowy zbiór zachowuje się w sensowny, interpretable sposób i może służyć jako wiarygodny punkt odniesienia.

Figure 2
Figure 2.

Nowe narzędzie dla badań nad czytaniem i inteligentnego oprogramowania

Wszystkie dane i kod są dostępne bezpłatnie w ustandaryzowanych formatach, co ułatwia innym naukowcom eksplorację. Językoznawcy mogą użyć Cuentos do badania cech specyficznych dla hiszpańskiego, takich jak końcówki wyrazów, szyk zdania czy styl. Psychologowie mogą analizować, jak różnią się strategie czytania między osobami albo jak gatunek wpływa na wysiłek poznawczy. Programiści zajmujący się sztuczną inteligencją i przetwarzaniem języka naturalnego mogą wprowadzić te informacje do modeli, które lepiej naśladują ludzkie czytanie, poprawiając zadania takie jak upraszczanie tekstów czy przewidywanie, które słowa są trudniejsze do zrozumienia. Mówiąc prosto, Cuentos przekształca subtelne ruchy oczu hiszpańskojęzycznych czytelników w potężne, wspólne narzędzie zarówno do zrozumienia umysłu, jak i tworzenia bardziej ludzkopodobnych technologii językowych.

Cytowanie: Travi, F., Bianchi, B., Slezak, D.F. et al. Cuentos: A Large-Scale Eye-Tracking Reading Corpus on Spanish Narrative Texts. Sci Data 13, 434 (2026). https://doi.org/10.1038/s41597-026-06798-z

Słowa kluczowe: śledzenie wzroku, czytanie, język hiszpański, przetwarzanie języka naturalnego, nauki kognitywne