Clear Sky Science · he

מאגר הנתונים לקריאה דו-כיוונית של טקסטים בסינית המסורתית: הרחבה של מאגר תנועות העיניים הרב-לשוני

· חזרה לאינדקס

מדוע המחקר הזה חשוב לקריאה יומיומית

רבים מאיתנו מניחים כי אנו קוראים משמאל לימין על פני הדף. אבל בסינית המסורתית הטקסט יכול לרוץ גם אופקית וגם אנכית, ורבים מהקוראים שותפים לשני הסגנונות. מאמר זה מציג מאגר נתונים גדול ואיכותי שעוקב אחר תנועות העיניים של קוראים כשהם קוראים קטעים בסינית המסורתית בשתי הכיוונים. על ידי השוואת האופן שבו העיניים נעות על גבי פריסות אופקיות ואנכיות של אותם טקסטים, החוקרים מאירים כיצד המערכת הוויזואלית והמוח מסתגלים לדרכים שונות להצבת מילים על הדף — ועד כמה הקריאה דומה מתחת לפני השטח.

שתי דרכים לפרוס את אותה שפה

הכתב הסיני המסורתי הוא צפוף חזותית ומורכב דמויות שכל אחת ממלאת מרובע אחיד. בניגוד לאנגלית, אין רווחים בין מילים, והדמויות יכולות להיות מסודרות בשורות אופקיות או בעמודות אנכיות. היסטורית, סינית נכתבה אנכית על רצועות במבוק או עצים; פריסות אופקיות הפכו לנפוצות רק במאה האחרונה, במיוחד בחומרים מדעיים וטכניים. היום, קוראים מקומות כמו הונג קונג נתקלים בשני הפורמטים בחיי היומיום, מהרומנים והעיתונים ועד לספרי הלימוד. הגמישות הבלתי שגרתית הזו מקנה למדענים הזדמנות נדירה לבדוק האם שינוי כיוון הטקסט משנה את המכניקה הבסיסית של הקריאה — או האם העין והמוח מטפלים בשתי הפריסות באורח דומה למדי.

Figure 1
Figure 1.

בניית מאגר מעקב עיניים עשיר

כדי לחקור שאלות אלה, המחברים יצרו את מאגר ה-Bidirectional Chinese MECO כחלק מפרויקט המאגר הרב-לשוני למעקב תנועות עיניים. שישים סטודנטים באוניברסיטה בהונג קונג קראו שתים-עשרה קטעים הסבריים בסינית המסורתית, בסגנון דומה לקטעי אנציקלופדיה קצרים או ערכי ויקיפדיה על נושאים כמו היסטוריה ותופעות טבע. כל משתתף קרא שישה קטעים בפריסה אופקית ושישה בפריסה אנכית, תוך התאמה מדוקדקת של אותן שורות טקסט בין הכיוונים. בזמן שהמשתתפים קראו בשקט מתוך כוונה להבין, עוקב עיניים בדיוק גבוה הקליט איפה הם הביטו ולכמה זמן, ותיעד מדדים רגע-רגע כגון כמה פעמים כל מילה הותקעה, כמה ארוכה הייתה ההצמדה, וכמה פעמים התרחש קפיצה אחורה.

מה שתנועות העיניים חושפות לגבי הקריאה

החוקרים עיבדו את נתוני המעקב כדי להסיר שגיאות טכניות והצמדות חריגות, וסיימו עם למעלה משלושים אלף תצפיות ברמת המילה. הם שחררו לאחר מכן את כל מערך הנתונים, יחד עם סקריפטים ותיעוד נלווים, בפורמטים שתואמים משאבים אחרים של MECO, מה שמקל על מדענים ברחבי העולם לשלב ולהשוות נתונים בין שפות. הצוות העריך עד כמה המדדים אמינים על ידי חלוקת הנתונים בדרכים שונות ובחינת האם אותם קוראים ואותן מילים הראו דפוסים עקביים. ברמת המשתתפים, האמינות הייתה גבוהה במיוחד: התנהגות הקריאה של אנשים הייתה יציבה באופן בולט בחלקים שונים של הטקסטים. ברמת המילה, האמינות הייתה נמוכה במקצת אך עדיין חזקה, בהתאמה למאגרים דומים בשפות אחרות, ואושש כי מערך הנתונים חזק מספיק לניתוחים מפורטים.

קריאה אופקית ואנכית: דומות יותר משהן שונות

לאחר מכן השתמשו המחברים במודלים סטטיסטיים מתקדמים כדי לבדוק האם השפעות ידועות על תנועות העיניים הופיעו גם במאגר החדש הזה, והאם הן השתנו עם כיוון הטקסט. כפי שנמצא במחקרים קודמים של סינית, העיניים הקדישו זמן רב יותר למילים ארוכות יותר, למילים נדירות יותר ולמילים בעלות מורכבות חזותית גבוהה עם הרבה מכות. דפוסים אלה נשמרו גם בקריאה אופקית וגם באנכית, מה שמראה שתהליכים מרכזיים של זיהוי מילים וטיפול בפרטים חזותיים משותפים בין הפריסות. קריאה אנכית אכן הובילה להצמדות מעט ארוכות יותר ולהשפעות חזקות יותר של אורך מילה ומורכבות חזותית, מה שמרמז שפריסות אנכיות יכולות להעמיד דרישות חזותיות מעט גבוהות יותר, במיוחד עבור קוראים שפוגשים אותן פחות. עם זאת, הדמיון הכללי היה בולט בהרבה מההבדלים.

Figure 2
Figure 2.

מה משמעות הדבר לקוראים ולמחקר עתידי

במונחים יומיומיים, המחקר מראה שקוראים מיומנים של סינית מסורתית מטפלים בטקסטים אופקיים ואנכיים ביעילות דומה באופן כללי: עיניהם מאטות באופן צפוי מול מילים קשות או מורכבות יותר, בלי תלות בכיוון השורות. המאגר החדש מציע משאב ציבורי עשיר שבו מדענים אחרים יכולים להשתמש כדי לבדוק תיאוריות על תנועות עיניים בזמן קריאה, להשוות מערכות כתיבה שונות ולתכנן כלים חינוכיים או עזרי גישה. מכיוון שכתיבה אנכית נשארת נפוצה בכמה שפות אסייתיות ובקרב קוראים סיניים מבוגרים, הבנת האופן שבו ניסיון ספציפי לכיוון מעצב תנועות עיניים עשויה גם לסייע בעיצוב חומרים ופעולות התערבות נוחים ונגישים יותר לקבוצות קוראים שונות.

ציטוט: Pan, J., Xi, Y., Tan, D. et al. The Corpus of Bidirectional Reading of Traditional Chinese Text: An Extension of the Multilingual Eye-Movement Corpus. Sci Data 13, 628 (2026). https://doi.org/10.1038/s41597-026-06989-8

מילות מפתח: מעקב עיניים, קריאה בסינית, כיוון טקסט, מחקר קריאה, זיהוי חזותי של מילים