Clear Sky Science · it

Racconti: un corpus di lettura con tracciamento oculare su larga scala su testi narrativi in spagnolo

· Torna all'indice

Perché osservare gli occhi può rivelare come leggiamo

Ogni volta che leggi una storia, i tuoi occhi si muovono, si fermano e saltano in modi che difficilmente noti — ma questi piccoli movimenti tracciano silenziosamente come funziona la tua mente. La maggior parte di ciò che sappiamo proviene da studi in inglese. Questo articolo presenta “Cuentos”, la più ampia raccolta pubblica di dati sui movimenti oculari di persone che leggono storie complete in spagnolo. Trasforma la danza invisibile degli occhi in una risorsa ricca per comprendere come leggono gli parlanti spagnoli e per costruire tecnologie linguistiche più intelligenti.

Storie, non frasi isolate

Invece di usare frasi brevi e artificiali, i ricercatori hanno chiesto a 113 madrelingua spagnoli di leggere storie complete e autonome scritte in spagnolo latino-americano. La raccolta include 30 racconti diversi — alcuni lunghi, altri brevi — che spaziano tra generi come realismo, horror, saggi e scrittura scientifica. In media, i racconti lunghi contengono circa 3.300 parole e quelli brevi circa 800, coprendo complessivamente quasi 40.000 parole e 8.500 termini distinti. Questa scelta cattura come le persone leggono in modo naturale testi narrativi, dall’inizio alla fine, anziché come elaborano righe isolate in laboratorio.

Figure 1
Figura 1.

Tracciare ogni pausa degli occhi

I partecipanti si sono seduti in una stanza oscurata e hanno letto le storie su uno schermo del computer mentre un tracciatore oculare ad alta velocità registrava dove guardavano mille volte al secondo. Il dispositivo ha catturato due comportamenti chiave: brevi soste chiamate fissazioni, quando gli occhi raccolgono informazioni dalla pagina, e rapidi salti chiamati saccadi, quando gli occhi si spostano in un nuovo punto. I testi erano suddivisi su più schermi e i lettori potevano spostarsi liberamente avanti e indietro usando i tasti freccia, proprio come si voltano le pagine. Dopo ogni storia rispondevano a domande di comprensione per verificare l’attenzione e, per i racconti brevi, svolgevano anche un breve compito di associazione di parole per ristabilire il focus prima del racconto successivo.

Trasformare i percorsi di sguardo grezzi in dati strutturati

Raccogliere punti grezzi di movimento oculare è solo l’inizio. Il team ha sviluppato software personalizzato per pulire e organizzare queste informazioni con grande cura. Hanno rimosso dati inaffidabili, come fissazioni estremamente brevi o molto lunghe e prove in cui il tracciatore aveva scarsa calibrazione. Per ogni schermo, revisori umani hanno aggiustato linee guida in modo che i raggruppamenti di fissazioni si allineassero precisamente con la riga di testo corretta. Quindi, usando la posizione degli spazi tra le parole, hanno assegnato le singole fissazioni alle parole specifiche. Casi speciali — come il grande salto dell’occhio dalla fine di una riga all’inizio della successiva, o ritorni accidentali a schermi precedenti — sono stati rilevati e filtrati. Il risultato è una mappa meticolosamente curata che collega ogni parola delle storie a quanto tempo, quanto spesso e con quale schema è stata osservata.

Cosa rivelano i movimenti oculari

Da queste tracce pulite gli autori hanno calcolato una ricca serie di misure per ogni parola. Alcune riflettono processi precoci e automatici, come la durata della prima fissazione o quanto a lungo una parola è osservata prima che gli occhi si spostino oltre. Altre catturano processi più tardivi e deliberati, come il tempo trascorso a tornare indietro per rileggere parole precedenti. Usando modelli statistici moderni, hanno confermato pattern ben noti in altre lingue, ora solidamente presenti anche in spagnolo: parole più corte e più frequenti vengono lette più rapidamente, e i lettori tendono a saltare del tutto parole molto brevi e familiari. Anche la posizione di una parola nella frase o sullo schermo influenza in modo sottile quanto a lungo gli occhi vi si soffermano. Questi controlli mostrano che il nuovo set di dati si comporta in modo sensato e interpretabile e può servire come benchmark affidabile.

Figure 2
Figura 2.

Un nuovo strumento per la ricerca sulla lettura e il software intelligente

Tutti i dati e il codice sono liberamente disponibili in formati standardizzati, facilitando l’esplorazione da parte di altri scienziati. I linguisti possono usare Cuentos per studiare caratteristiche specifiche dello spagnolo come le desinenze, l’ordine delle parole e lo stile. Gli psicologi possono esaminare come gli individui differiscono nelle strategie di lettura o come il genere influisce sul carico mentale. Gli sviluppatori di intelligenza artificiale ed elaborazione del linguaggio naturale possono alimentare queste informazioni in modelli che riproducono meglio la lettura umana, migliorando compiti come rendere i testi più leggibili o prevedere quali parole sono più difficili da comprendere. In termini semplici, Cuentos trasforma i movimenti sottili degli occhi dei lettori spagnoli in uno strumento condiviso potente sia per comprendere la mente sia per costruire tecnologie linguistiche più simili a quelle umane.

Citazione: Travi, F., Bianchi, B., Slezak, D.F. et al. Cuentos: A Large-Scale Eye-Tracking Reading Corpus on Spanish Narrative Texts. Sci Data 13, 434 (2026). https://doi.org/10.1038/s41597-026-06798-z

Parole chiave: tracciamento oculare, lettura, lingua spagnola, elaborazione del linguaggio naturale, scienze cognitive