Clear Sky Science · nl

Cuentos: Een grootschalig oogbewegingscorpus voor het lezen van Spaanse narratieve teksten

· Terug naar het overzicht

Waarom het volgen van ogen onthult hoe we lezen

Telkens wanneer u een verhaal leest, schieten uw ogen, pauzeren ze en springen ze op manieren die u nauwelijks opmerkt—maar deze kleine bewegingen laten stilletjes zien hoe uw geest werkt. Het merendeel van wat we hierover weten, komt uit onderzoeken in het Engels. Dit artikel introduceert “Cuentos”, de grootste openbare verzameling oogbewegingsgegevens van mensen die volledige verhalen in het Spaans lezen. Het verandert de onzichtbare dans van de ogen in een rijke bron om te begrijpen hoe Spaanstaligen lezen en om slimmere taalkundige toepassingen te bouwen.

Verhalen, geen geïsoleerde zinnen

In plaats van korte, kunstmatige zinnen te gebruiken, vroegen de onderzoekers 113 moedertaalsprekers van het Spaans complete, op zichzelf staande verhalen te lezen, geschreven in Latijn-Amerikaans Spaans. De verzameling bevat 30 verschillende vertellingen—sommige lang, sommige kort—en bestrijkt genres als realisme, horror, essays en wetenschapsjournalistiek. Gemiddeld bevatten lange verhalen ongeveer 3.300 woorden en korte ongeveer 800, samen bijna 40.000 woorden en 8.500 verschillende termen. Dit ontwerp legt vast hoe mensen op natuurlijke wijze narratieve teksten lezen, van begin tot eind, in plaats van hoe ze geïsoleerde zinnen in een laboratorium verwerken.

Figure 1
Figure 1.

Elke pauze van de ogen volgen

Deelnemers zaten in een verduisterde ruimte en lazen verhalen op een computerscherm terwijl een hogesnelheids-oogvolgsysteem registreerde waar ze naar keken, duizend keer per seconde. Het apparaat legde twee sleutelgedragingen vast: korte stops die fixaties worden genoemd, wanneer de ogen informatie van de pagina verzamelen, en snelle sprongen die saccades heten, wanneer de ogen naar een nieuwe plek bewegen. De teksten waren verdeeld over meerdere schermen en lezers konden vrij heen en weer bewegen met de pijltjestoetsen, net zoals iemand pagina’s zou omslaan. Na elk verhaal beantwoordden ze begripsvragen om te verzekeren dat ze opletten, en bij de korte verhalen deden ze ook een korte woordassociatietaak om hun aandacht te resetten voor het volgende verhaal.

Ruwe blikpaden omzetten in gestructureerde data

Het verzamelen van ruwe oogbewegingspunten is slechts het begin. Het team bouwde speciale software om deze informatie zorgvuldig te reinigen en te organiseren. Ze verwijderden onbetrouwbare data, zoals extreem korte of zeer lange fixaties en trials waarbij de oogvolger slecht gekalibreerd was. Voor elk scherm stelden menselijke beoordelaars hulplijnen bij zodat clusters van fixaties precies op de juiste tekstregel uitkwamen. Vervolgens keken ze naar de positie van spaties tussen woorden om individuele fixaties aan specifieke woorden toe te wijzen. Speciale gevallen—zoals de grote sprong van het einde van de ene regel naar het begin van de volgende, of per ongeluk terugkeren naar eerdere schermen—werden gedetecteerd en eruit gefilterd. Het resultaat is een zorgvuldig gecureerde kaart die elk woord in de verhalen koppelt aan hoe lang, hoe vaak en in welk patroon het bekeken werd.

Wat de oogbewegingen onthullen

Uit deze geschoonde sporen berekenden de auteurs een rijke reeks maten voor elk woord. Sommige weerspiegelen vroege, automatische verwerking, zoals hoe lang de eerste fixatie duurt of hoe lang een woord bekeken wordt voordat de ogen verdergaan. Andere vangen latere, meer bewuste verwerking, zoals de tijd die wordt besteed aan terugkeren om eerder gelezen woorden opnieuw te lezen. Met moderne statistische modellen bevestigden ze bekende patronen uit andere talen, nu ook duidelijk in het Spaans: kortere en frequentere woorden worden sneller gelezen, en lezers slaan zeer korte, vertrouwde woorden vaker helemaal over. Waar een woord in een zin of op het scherm voorkomt, beïnvloedt ook subtiel hoe lang de ogen erop blijven hangen. Deze controles tonen aan dat de nieuwe dataset zich op een zinvolle, interpreteerbare manier gedraagt en als een betrouwbaar referentiepunt kan dienen.

Figure 2
Figure 2.

Een nieuw hulpmiddel voor leesonderzoek en slimme software

Alle data en code zijn vrij beschikbaar in gestandaardiseerde formaten, waardoor het voor andere wetenschappers eenvoudig is om te verkennen. Taalkundigen kunnen Cuentos gebruiken om Spaanstalige kenmerken te bestuderen, zoals woorduitgangen, woordvolgorde en stijl. Psychologen kunnen onderzoeken hoe individuen verschillen in hun leesstrategieën of hoe genre de mentale inspanning beïnvloedt. Ontwikkelaars in kunstmatige intelligentie en natuurlijke taalverwerking kunnen deze informatie in modellen voeden die menselijk lezen beter nabootsen, wat taken verbetert zoals het eenvoudiger maken van teksten of het voorspellen welke woorden moeilijker te begrijpen zijn. In eenvoudige termen zet Cuentos de subtiele bewegingen van de ogen van Spaanstalige lezers om in een krachtig gedeeld instrument voor zowel het begrijpen van de geest als het bouwen van menselijker taaltechnologieën.

Bronvermelding: Travi, F., Bianchi, B., Slezak, D.F. et al. Cuentos: A Large-Scale Eye-Tracking Reading Corpus on Spanish Narrative Texts. Sci Data 13, 434 (2026). https://doi.org/10.1038/s41597-026-06798-z

Trefwoorden: eye tracking, reading, Spanish language, natural language processing, cognitive science