Clear Sky Science · pt
O Corpus de Leitura Bidirecional de Textos Chineses Tradicionais: Uma Extensão do Corpus Multilíngue de Movimentos oculares
Por que este estudo importa para a leitura no dia a dia
A maioria de nós dá como certa a leitura da esquerda para a direita numa página. Mas no chinês tradicional, o texto pode correr horizontalmente ou verticalmente, e muitos leitores se sentem confortáveis com ambos os estilos. Este artigo apresenta um grande conjunto de dados cuidadosamente coletado que registra os movimentos oculares de leitores enquanto eles lêem trechos em chinês tradicional em ambas as direções. Ao comparar como os olhos se movem em layouts horizontais e verticais dos mesmos textos, os pesquisadores esclarecem como nosso sistema visual e cérebro se adaptam a diferentes modos de dispor palavras na página — e o quão semelhantes a leitura realmente é por baixo da superfície.
Duas maneiras de apresentar a mesma língua
A escrita tradicional chinesa é visualmente densa e composta por caracteres que ocupam cada um o mesmo espaço quadrado. Ao contrário do inglês, não há espaços entre palavras, e os caracteres podem ser dispostos em linhas horizontais ou colunas verticais. Historicamente, o chinês era escrito verticalmente em tiras de bambu ou madeira; layouts horizontais só se tornaram amplamente usados no último século, especialmente para materiais científicos e técnicos. Hoje, leitores em lugares como Hong Kong ainda encontram ambos os formatos no dia a dia, de romances e jornais a livros didáticos. Essa flexibilidade incomum oferece aos cientistas uma oportunidade rara de perguntar se mudar a direção do texto altera a mecânica básica da leitura — ou se o olho e o cérebro lidam com os dois layouts de forma amplamente semelhante.

Construindo um corpus rico de rastreamento ocular
Para explorar essas questões, os autores criaram o corpus Bidirectional Chinese MECO como parte do projeto maior Multilingual Eye-Movement Corpus. Sessenta estudantes universitários em Hong Kong leram doze trechos expositivos em chinês tradicional, semelhantes em estilo a entradas curtas de enciclopédia ou Wikipédia sobre temas como história e fenômenos naturais. Cada pessoa leu seis trechos em layout horizontal e seis em layout vertical, com as mesmas linhas de texto cuidadosamente alinhadas entre as direções. Enquanto os participantes liam silenciosamente para compreensão, um rastreador ocular de alta precisão registrou onde olhavam e por quanto tempo, capturando medidas momento a momento, como quantas vezes cada palavra foi fixada, quanto tempo o olho permaneceu e com que frequência ele recuou.
O que os movimentos oculares revelam sobre a leitura
Os pesquisadores processaram os dados de rastreamento ocular para remover erros técnicos e fixações incomuns, terminando com mais de trinta mil observações ao nível da palavra. Eles então divulgaram todo o conjunto de dados, além de scripts e documentação acompanhantes, em formatos que correspondem a outros recursos do MECO, facilitando que cientistas do mundo todo combinem e comparem dados entre idiomas. A equipe estimou quão confiáveis eram as medidas dividindo os dados de maneiras diferentes e verificando se os mesmos leitores e as mesmas palavras mostravam padrões consistentes. No nível dos participantes, a confiabilidade foi extremamente alta: o comportamento de leitura das pessoas revelou-se notavelmente estável em diferentes partes dos textos. No nível da palavra, a confiabilidade foi um pouco menor, mas ainda forte, em linha com corpora semelhantes em outros idiomas, confirmando que o conjunto de dados é robusto o suficiente para análises detalhadas.
Leitura horizontal e vertical: mais parecidas do que diferentes
Em seguida, os autores usaram modelos estatísticos avançados para testar se influências bem conhecidas sobre os movimentos oculares também apareciam neste novo corpus e se mudavam com a direção do texto. Como em estudos anteriores do chinês, os olhos passaram mais tempo em palavras mais longas, palavras mais raras e palavras visualmente mais complexas com muitos traços. Esses padrões foram observados tanto na leitura horizontal quanto na vertical, mostrando que processos centrais de reconhecimento de palavras e de lidar com detalhes visuais são compartilhados entre os layouts. A leitura vertical levou a fixações um pouco mais longas e a efeitos mais fortes de comprimento da palavra e complexidade visual, sugerindo que passagens verticais podem impor demandas visuais ligeiramente maiores, especialmente para leitores que as encontram com menos frequência. Ainda assim, as semelhanças gerais foram muito mais proeminentes do que as diferenças.

O que isso significa para leitores e pesquisas futuras
Em termos práticos, este estudo mostra que leitores proficientes de chinês tradicional lidam com textos horizontais e verticais com eficiência amplamente semelhante: seus olhos desaceleram de maneiras previsíveis diante de palavras mais difíceis ou mais complexas, independentemente da direção das linhas. O novo corpus oferece um rico recurso público que outros cientistas podem usar para testar teorias sobre como os olhos se movem durante a leitura, comparar diferentes sistemas de escrita e projetar ferramentas educacionais ou assistivas. Como a escrita vertical permanece comum em várias línguas asiáticas e entre leitores chineses mais velhos, entender como a experiência específica de uma direção molda os movimentos oculares também pode ajudar a desenhar materiais de leitura e intervenções mais confortáveis e acessíveis para diferentes grupos de leitores.
Citação: Pan, J., Xi, Y., Tan, D. et al. The Corpus of Bidirectional Reading of Traditional Chinese Text: An Extension of the Multilingual Eye-Movement Corpus. Sci Data 13, 628 (2026). https://doi.org/10.1038/s41597-026-06989-8
Palavras-chave: rastreamento ocular, leitura do chinês, direção do texto, pesquisa sobre leitura, reconhecimento visual de palavras