Clear Sky Science · sv

Cuentos: Ett storskaligt ögonspårningskorpus för läsning av spanska berättelser

· Tillbaka till index

Varför ögonrörelser kan avslöja hur vi läser

Varje gång du läser en berättelse rör sig ögonen, stannar och hoppar på sätt du knappt märker — men dessa små rörelser visar tyst hur ditt sinne arbetar. Det mesta vi vet om detta kommer från studier på engelska. Denna artikel presenterar ”Cuentos”, den största publika samlingen av ögonrörelsedata från personer som läser fullständiga berättelser på spanska. Den förvandlar ögats osynliga dans till en rik resurs för att förstå hur spansktalande läser och för att bygga smartare språkteknologi.

Berättelser, inte isolerade meningar

I stället för att använda korta, artificiella meningar bad forskarna 113 modersmålstalande spanska talare att läsa kompletta, fristående berättelser skrivna på latinamerikansk spanska. Samlingen innehåller 30 olika berättelser — några långa, några korta — och täcker genrer som realism, skräck, essäer och populärvetenskap. I genomsnitt innehåller de långa berättelserna cirka 3 300 ord och de korta omkring 800, tillsammans nästan 40 000 ord och 8 500 distinkta termer. Denna design fångar hur människor naturligt läser narrativa texter, från början till slut, snarare än hur de bearbetar isolerade rader i ett laboratorium.

Figure 1
Figure 1.

Spåra varje ögonpaus

Deltagarna satt i ett nedsläckt rum och läste berättelser på en datorskärm medan en högupplöst ögonspårare registrerade vart de tittade tusen gånger per sekund. Enheten fångade två centrala beteenden: korta stopp kallade fixeringar, när ögonen samlar information från sidan, och snabba hopp kallade sakkader, när ögonen rör sig till en ny punkt. Texter delades upp över flera skärmar, och läsarna kunde fritt röra sig fram och tillbaka med piltangenterna, precis som när man bläddrar mellan sidor. Efter varje berättelse svarade de på förståelsefrågor för att säkerställa att de följt innehållet, och för de korta berättelserna gjorde de också en kort ordassociationsuppgift för att återställa fokus inför nästa berättelse.

Omvandla råa blickspår till strukturerad data

Att samla in råa ögonrörelsepunkter är bara början. Teamet byggde specialprogramvara för att rensa och organisera denna information med stor omsorg. De tog bort opålitlig data, såsom extremt korta eller mycket långa fixeringar och försök där ögonspåraren hade dålig kalibrering. För varje skärm justerade mänskliga granskare ledlinjer så att kluster av fixeringar stämde exakt överens med rätt textrad. Därefter, med hjälp av mellanrummens position mellan ord, tilldelades enskilda fixeringar specifika ord. Specialfall — som ögats stora hopp från slutet av en rad till början av nästa, eller oavsiktliga återvändanden till tidigare skärmar — upptäcktes och filtrerades bort. Resultatet är en minutiöst kurerad karta som länkar varje ord i berättelserna till hur länge, hur ofta och i vilket mönster det betraktades.

Vad ögonrörelserna avslöjar

Från dessa rensade spår beräknade författarna ett rikt måttssortiment för varje ord. Vissa speglar tidig, automatisk bearbetning, såsom hur lång den första fixeringen är eller hur länge ett ord tittas på innan ögonen går vidare. Andra fångar senare, mer avsiktlig bearbetning, såsom tid som läggs på att återvända för att omläsa tidigare ord. Med moderna statistiska modeller bekräftade de välkända mönster från andra språk nu tydligt i spanska: kortare och vanligare ord läses snabbare, och läsare tenderar att hoppa över mycket korta, bekanta ord helt. Var ett ord förekommer i en sats eller på skärmen påverkar också subtilt hur länge ögonen dröjer vid det. Dessa kontroller visar att den nya datasetten beter sig på ett rimligt, tolkbart sätt och kan fungera som en pålitlig referens.

Figure 2
Figure 2.

Ett nytt verktyg för läsforskning och smart programvara

All data och kod är fritt tillgängliga i standardiserade format, vilket gör det enkelt för andra forskare att utforska materialet. Lingvister kan använda Cuentos för att studera språkspecifika drag i spanska, såsom ordändelser, ordföljd och stil. Psykologer kan undersöka hur individer skiljer sig i sina lässtrategier eller hur genre påverkar mental ansträngning. Utvecklare inom artificiell intelligens och naturlig språkbehandling kan mata dessa uppgifter till modeller som bättre efterliknar mänsklig läsning, vilket förbättrar uppgifter som att göra texter lättare att läsa eller förutsäga vilka ord som är svårare att förstå. Kort sagt förvandlar Cuentos de spanska läsarnas subtila ögonrörelser till ett kraftfullt, delat verktyg för både att förstå sinnet och bygga mer mänskliga språkteknologier.

Citering: Travi, F., Bianchi, B., Slezak, D.F. et al. Cuentos: A Large-Scale Eye-Tracking Reading Corpus on Spanish Narrative Texts. Sci Data 13, 434 (2026). https://doi.org/10.1038/s41597-026-06798-z

Nyckelord: ögonspårning, läsning, spanska språket, språkbehandling, kognitionsvetenskap