Clear Sky Science · fr

Le Corpus de Lecture Bidirectionnelle du Chinois Traditionnel : une Extension du Corpus Multilingue de Mouvements Oculaires

· Retour à l’index

Pourquoi cette étude compte pour la lecture quotidienne

La plupart d’entre nous tiennent pour acquis que l’on lit de gauche à droite sur une page. Mais en chinois traditionnel, le texte peut s’écrire horizontalement ou verticalement, et de nombreux lecteurs sont à l’aise avec les deux formats. Cet article présente un vaste jeu de données collecté soigneusement qui suit les mouvements oculaires des lecteurs lorsqu’ils parcourent des passages en chinois traditionnel dans les deux directions. En comparant la façon dont les yeux se déplacent sur des mises en page horizontales et verticales du même texte, les chercheurs éclairent la manière dont notre système visuel et notre cerveau s’adaptent à différentes façons d’organiser les mots sur une page — et dans quelle mesure la lecture est fondamentalement similaire sous la surface.

Deux manières de disposer la même langue

L’écriture chinoise traditionnelle est visuellement dense et composée de caractères occupant chacun le même carré. Contrairement à l’anglais, il n’y a pas d’espaces entre les mots, et les caractères peuvent être disposés en lignes horizontales ou en colonnes verticales. Historiquement, le chinois était écrit verticalement sur des lattes de bambou ou de bois ; les mises en page horizontales ne se sont généralisées que le siècle dernier, surtout pour les textes scientifiques et techniques. Aujourd’hui, des lecteurs dans des lieux comme Hong Kong rencontrent encore les deux formats dans la vie quotidienne, des romans et journaux aux manuels scolaires. Cette flexibilité inhabituelle offre aux scientifiques une rare occasion de se demander si changer la direction du texte modifie les mécanismes fondamentaux de la lecture — ou si l’œil et le cerveau traitent les deux mises en page de façon essentiellement similaire.

Figure 1
Figure 1.

Construire un corpus riche de suivi oculaire

Pour explorer ces questions, les auteurs ont créé le corpus Bidirectional Chinese MECO dans le cadre du projet plus large Multilingual Eye-Movement Corpus. Soixante étudiants universitaires à Hong Kong ont lu douze passages explicatifs en chinois traditionnel, de style comparable à de courts articles d’encyclopédie ou de Wikipédia sur des thèmes comme l’histoire et les phénomènes naturels. Chaque personne a lu six passages en disposition horizontale et six en disposition verticale, les lignes de texte étant soigneusement appariées entre les directions. Pendant que les participants lisaient silencieusement pour la compréhension, un eye tracker de haute précision a enregistré où ils regardaient et pendant combien de temps, capturant des mesures instantanées telles que le nombre de fixations par mot, la durée de maintien du regard et la fréquence des retours en arrière.

Ce que révèlent les mouvements oculaires sur la lecture

Les chercheurs ont traité les données de suivi oculaire pour éliminer les erreurs techniques et les fixations atypiques, obtenant plus de trente mille observations au niveau du mot. Ils ont ensuite rendu l’ensemble du jeu de données public, ainsi que les scripts et la documentation associés, dans des formats compatibles avec les autres ressources MECO, facilitant la combinaison et la comparaison des données entre langues pour des chercheurs du monde entier. L’équipe a estimé la fiabilité des mesures en divisant les données de différentes manières et en vérifiant si les mêmes lecteurs et les mêmes mots montraient des schémas cohérents. Au niveau des participants, la fiabilité était extrêmement élevée : le comportement de lecture des personnes était remarquablement stable selon les différentes parties des textes. Au niveau des mots, la fiabilité était un peu plus faible mais restait solide, en accord avec des corpus similaires dans d’autres langues, confirmant que l’ensemble de données est suffisamment robuste pour des analyses détaillées.

Lecture horizontale et verticale : plus de ressemblances que de différences

Les auteurs ont ensuite utilisé des modèles statistiques avancés pour tester si des facteurs connus influençant les mouvements oculaires apparaissaient également dans ce nouveau corpus, et s’ils variaient selon la direction du texte. Comme dans des études antérieures sur le chinois, les yeux consacraient plus de temps aux mots plus longs, aux mots plus rares et aux mots visuellement plus complexes avec de nombreux traits. Ces tendances étaient présentes tant en lecture horizontale qu’en lecture verticale, montrant que les processus fondamentaux de reconnaissance des mots et de traitement du détail visuel sont partagés entre les deux mises en page. La lecture verticale entraînait toutefois des fixations légèrement plus longues et des effets plus marqués de la longueur des mots et de la complexité visuelle, ce qui suggère que les passages verticaux peuvent imposer des demandes visuelles un peu plus fortes, en particulier pour les lecteurs qui les rencontrent moins souvent. Néanmoins, les similarités globales étaient bien plus nettes que les différences.

Figure 2
Figure 2.

Ce que cela signifie pour les lecteurs et la recherche future

Concrètement, cette étude montre que les lecteurs compétents du chinois traditionnel gèrent la lecture horizontale et verticale avec une efficacité globalement similaire : leurs yeux ralentissent de manière prévisible sur les mots plus difficiles ou plus complexes, quelle que soit l’orientation des lignes. Le nouveau corpus offre une ressource publique riche que d’autres chercheurs peuvent utiliser pour tester des théories sur les mouvements oculaires pendant la lecture, comparer différents systèmes d’écriture et concevoir des outils éducatifs ou d’assistance. Étant donné que l’écriture verticale demeure courante dans plusieurs langues asiatiques et chez des lecteurs chinois plus âgés, comprendre comment l’expérience liée à une direction particulière façonne les mouvements oculaires peut aussi aider à concevoir des matériaux de lecture et des interventions plus confortables et accessibles pour différents groupes de lecteurs.

Citation: Pan, J., Xi, Y., Tan, D. et al. The Corpus of Bidirectional Reading of Traditional Chinese Text: An Extension of the Multilingual Eye-Movement Corpus. Sci Data 13, 628 (2026). https://doi.org/10.1038/s41597-026-06989-8

Mots-clés: suivi oculaire, lecture du chinois, direction du texte, recherche sur la lecture, reconnaissance visuelle des mots