Clear Sky Science · he
סיפורונים: קורפוס קריאה בקנה מידה גדול עם מעקב עיניים על טקסטים נרטיביים בספרדית
מדוע צפייה בעיניים יכולה לחשוף כיצד אנו קוראים
בכל פעם שאתם קוראים סיפור, עיניכם זזות, עוצרות וקופצות בדרכים שאתם כמעט לא מבחינים בהן—אך תנועות זעירות אלה עוקבות בשקט אחר הדרך שבה המוח שלכם עובד. רוב מה שאנו יודעים על כך מגיע ממחקרים באנגלית. מאמר זה מציג את "Cuentos," האוסף הציבורי הגדול ביותר של נתוני תנועות עיניים מאנשים שקוראים סיפורים מלאים בספרדית. הוא הופך את הריקוד הבלתי נראה של העיניים למשאב עשיר להבנת אופן הקריאה של דוברי ספרדית ולבניית טכנולוגיות שפה חכמות יותר.
סיפורים, לא משפטים מנותקים
במקום להשתמש במשפטים קצרים ומלאכותיים, החוקרים ביקשו מ-113 דוברים ילידים של ספרדית לקרוא סיפורים שלמים ועצמאיים שנכתבו בספרדית אמריקה הלטינית. האוסף כולל 30 מעשיות שונות—חלקן ארוכות, חלקן קצרות—ובעולמות ז'אנרים כמו ריאליזם, אימה, מאמרים וכתיבה מדעית. בממוצע, סיפורים ארוכים מכילים כ-3,300 מילים, והקצרים כ-800, וביחד מקיפים כמעט 40,000 מילים ו-8,500 מונחים מובחנים. התכנון הזה לוכד כיצד אנשים קוראים טקסטים נרטיביים באופן טבעי, מתחילתם ועד סופם, במקום כיצד הם מעבדים שורות מנותקות במעבדה.

מעקב אחר כל עצירת עין
המשתתפים ישבו בחדר מואר חשוך וקראו סיפורים על מסך מחשב בזמן שעוקב עיניים מהיר הקליט היכן הם הביטו אלף פעמים בשנייה. המכשיר תפס שתי התנהגויות מרכזיות: עצירות קצרות שנקראות תקיפויות (fixations), כאשר העיניים אוספות מידע מהדף, וקפיצות מהירות שנקראות סקאדות (saccades), כאשר העיניים נעות לנקודה חדשה. הטקסטים חולקו על פני מספר מסכים, והקוראים יכלו לזוז חופשית קדימה ואחורה באמצעות מקשי החיצים, בדיוק כמו שמישהו יכול להפוך בין עמודים. לאחר כל סיפור הם ענו על שאלות הבנה כדי לוודא שעקבו אחרי התוכן, ועבור הסיפורים הקצרים הם גם ביצעו מטלת אסוציאציית מילים קצרה כדי לאפס את המיקוד לפני המעשה הבא.
הפיכת מסלולי המבט הגולמיים לנתונים מובנים
איסוף נקודות תנועת עין גולמיות הוא רק ההתחלה. הצוות בנה תוכנה מותאמת לניקוי וארגון המידע הזה בתשומת לב מרובה. הם הסירו נתונים בלתי מהימנים, כמו תקיפויות קצרות מאוד או ארוכות מאוד וניסיונות שבהם המעקב היה בעל כייל גרוע. עבור כל מסך, מבקרים אנושיים הסתתרו קווי הדרכה כך שאשכולות התקיפויות יalign בדיוק עם שורת הטקסט המתאימה. לאחר מכן, באמצעות מיקום הרווחים בין המילים, הם הקצו תקיפויות אינדיבידואליות למילים ספציפיות. מקרים מיוחדים—כמו הקפיצה הגדולה של העין מסוף שורה לתחילת השורה הבאה, או חזרות מקריות למסכים קודמים—זוהו וסוננו החוצה. התוצאה היא מפה מעודנת בקפדנות שמקשרת כל מילה בסיפורים לאופן שבו היא נצפתה: כמה זמן, כמה פעמים ובאיזה דפוס.
מה תנועות העיניים חושפות
ממתאים הנקיות האלה, המחברים חישבו סט עשיר של מדדים עבור כל מילה. חלקם משקפים עיבוד מוקדם ואוטומטי, כגון כמה זמן נמשכת התקיפה הראשונה או כמה זמן מביטים במילה לפני שהעיניים ממשיכות הלאה. אחרים לוכדים עיבוד מאוחר יותר ומודע יותר, כגון הזמן שמושקע בחזרה לקריאה מחודשת של מילים קודמות. באמצעות מודלים סטטיסטיים מודרניים הם איששו תבניות ידועות משפות אחרות שעתה מובחנות היטב גם בספרדית: מילים קצרות ותכופות נקראות מהר יותר, וקוראים נוטים לדלג על מילים קצרות ומוכרות לחלוטין. גם מיקום המילה במשפט או על המסך מעצב בעדינות כמה זמן העיניים נשארות עליה. בדיקות אלה מראות שהמערכת החדשה מתנהגת באופן סביר וניתן לפרש אותה, ומהווה נקודת ייחוס אמינה.

כלי חדש למחקר קריאה ותוכנה חכמה
כל הנתונים והקוד זמינים בחופשיות בפורמטים סטנדרטיים, מה שמקל על מדענים אחרים לחקור. בלשנים יכולים להשתמש ב-Cuentos כדי לחקור תכונות ספציפיות לספרדית כמו סיומות המילים, סדר המילים וסגנון. פסיכולוגים יכולים לבחון כיצד פרטים שונים באסטרטגיות הקריאה או כיצד הז'אנר משפיע על המאמץ המנטלי. מפתחי בינה מלאכותית ועיבוד שפה טבעית יכולים להזין מידע זה לתוך מודלים שחוקים יותר את הקריאה האנושית, ולשפר משימות כמו הפיכת טקסטים לקלים יותר לקריאה או חיזוי אילו מילים קשות יותר להבנה. במילים פשוטות, Cuentos הופך את התנועות העדינות של עיניהם של קוראי הספרדית לכלי משותף חזק הן להבנת המחשבה והן לבניית טכנולוגיות שפה הדומות יותר לאדם.
ציטוט: Travi, F., Bianchi, B., Slezak, D.F. et al. Cuentos: A Large-Scale Eye-Tracking Reading Corpus on Spanish Narrative Texts. Sci Data 13, 434 (2026). https://doi.org/10.1038/s41597-026-06798-z
מילות מפתח: מעקב עיניים, קריאה, השפה הספרדית, עיבוד שפה טבעית, מדע קוגניטיבי