Clear Sky Science · ru

Корпус двунаправленного чтения на традиционном китайском: расширение многоязычного корпуса движений глаз

· Назад к списку

Почему это исследование важно для повседневного чтения

Большинство из нас воспринимает как данность, что читают слева направо по странице. Но в традиционном китайском текст может располагаться как по горизонтали, так и по вертикали, и многие читатели одинаково комфортно воспринимают оба формата. В этой статье представлен большой, тщательно собранный набор данных, фиксирующий движения глаз читателей при чтении отрывков на традиционном китайском в обоих направлениях. Сравнивая, как глаза перемещаются по горизонтальным и вертикальным макетам одного и того же текста, исследователи проливают свет на то, как наша визуальная система и мозг адаптируются к разным способам расположения слов на странице — и насколько чтение на самом деле похоже под поверхностью.

Два способа оформления одного и того же языка

Традиционное китайское письмо визуально плотное и состоит из иероглифов, каждый из которых занимает одинаковое квадратное пространство. В отличие от английского, между словами нет пробелов, а символы можно располагать в горизонтальные строки или вертикальные столбцы. Исторически китай писали вертикально на бамбуковых или деревянных дощечках; горизонтальные оформления стали широко использоваться только в прошлом веке, особенно в научной и технической литературе. Сегодня читатели в таких местах, как Гонконг, по‑прежнему встречают оба формата в повседневной жизни — в романах, газетах и учебниках. Эта необычная гибкость дает учёным редкую возможность проверить, меняет ли направление текста базовые механики чтения или же глаза и мозг обрабатывают оба оформления по сути одинаково.

Figure 1
Figure 1.

Создание богатого корпуса данных отслеживания взгляда

Чтобы изучить эти вопросы, авторы создали корпус Bidirectional Chinese MECO в рамках более крупного проекта Multilingual Eye-Movement Corpus. Шестьдесят студентов университетов в Гонконге прочитали двенадцать научно-популярных отрывков на традиционном китайском, по стилю похожих на короткие статьи энциклопедий или Википедии на темы вроде истории и природных явлений. Каждый участник прочитал шесть отрывков в горизонтальном оформлении и шесть — в вертикальном, при этом тексты были аккуратно сопоставлены по строкам в обоих направлениях. Во время немого чтения с пониманием высокоточный трекер глаз фиксировал, куда смотрели участники и как долго, фиксируя покадровые показатели, такие как число фиксаций на слове, длительность задержки взгляда и частота ретроспекций.

Что показывают движения глаз о процессе чтения

Исследователи обработали данные отслеживания взгляда, удалив технические артефакты и необычные фиксации, в результате чего получилось более тридцати тысяч наблюдений на уровне слов. Затем они опубликовали весь набор данных вместе со скриптами и документацией в форматах, совместимых с другими ресурсами MECO, чтобы учёным по всему миру было легко объединять и сравнивать данные между языками. Команда оценивала надежность мер, разделяя данные разными способами и проверяя, показывают ли одни и те же читатели и одни и те же слова устойчивые закономерности. На уровне участников надежность оказалась чрезвычайно высокой: поведение при чтении было поразительно стабильным в разных частях текстов. На уровне слов надежность была несколько ниже, но всё ещё сильной, сопоставимой с аналогичными корпусами на других языках, что подтверждает пригодность набора данных для детального анализа.

Горизонтальное и вертикальное чтение: больше сходств, чем различий

Далее авторы применили продвинутые статистические модели, чтобы проверить, проявляются ли в новом корпусе хорошо известные факторы, влияющие на движение глаз, и меняются ли они с направлением текста. Как и в предыдущих исследованиях китайского, глаза задерживались дольше на более длинных словах, на редких словах и на визуально более сложных символах с большим числом штрихов. Эти закономерности сохранялись и при горизонтальном, и при вертикальном чтении, что показывает: ключевые процессы распознавания слов и обработки визуальной детализации общи для обоих макетов. Вертикальное чтение приводило к несколько более долгим фиксациям и более сильным эффектам длины слова и визуальной сложности, что указывает на то, что вертикальные отрывки могут предъявлять слегка повышенные визуальные требования, особенно для читателей, сталкивающихся с ними реже. Тем не менее общие сходства были гораздо заметнее, чем различия.

Figure 2
Figure 2.

Что это значит для читателей и будущих исследований

В повседневном плане исследование показывает: опытные читатели традиционного китайского в целом одинаково эффективно справляются как с горизонтальным, так и с вертикальным текстом — их глаза замедляются предсказуемо при встрече с более трудными или более сложными словами независимо от направления строк. Новый корпус представляет собой богатый общедоступный ресурс, который другие учёные могут использовать для проверки теорий движения глаз при чтении, сравнения разных систем письма и разработки образовательных или вспомогательных средств. Поскольку вертикальное письмо остаётся распространённым в нескольких азиатских языках и среди старших поколений китайских читателей, понимание того, как опыт, связанный с направлением текста, формирует движения глаз, может помочь в создании материалов и интервенций, более комфортных и доступных для разных групп читателей.

Цитирование: Pan, J., Xi, Y., Tan, D. et al. The Corpus of Bidirectional Reading of Traditional Chinese Text: An Extension of the Multilingual Eye-Movement Corpus. Sci Data 13, 628 (2026). https://doi.org/10.1038/s41597-026-06989-8

Ключевые слова: отслеживание взгляда, чтение на китайском, направление текста, исследование чтения, визуальное распознавание слов