Clear Sky Science · ja
伝統中国語の双方向読書コーパス:多言語視線運動コーパスの拡張
日常の読書にとってこの研究が重要な理由
私たちの多くは、ページを左から右へ読むのが当然だと考えがちです。しかし伝統中国語では、文章が横書きにも縦書きにもなり、多くの読者が両方の形式に慣れています。本論文は、伝統中国語の同じ文章を横書きと縦書きで読んでもらい、その際の読者の視線運動を精緻に記録した大規模なデータセットを紹介します。同一テキストの横・縦レイアウトにおける眼球の動きを比較することで、視覚系や脳がページ上に語を配置する異なる方法にどのように適応するか、あるいは表面的には異なって見えても読みの基本がどれほど似ているかを明らかにします。
同じ言語を配置する二つの方法
伝統中国語の文字は視覚的に密で、それぞれの字が同じ四角スペースを満たすように配置されます。英語とは異なり語間にスペースはなく、文字は横一列にも縦一列にも並べられます。歴史的には中国語は竹簡や木簡に縦書きで書かれており、横書きが広く普及したのは特に近代になってからで、科学や技術関連の資料で顕著でした。今日でも香港のような地域では、小説や新聞、教科書に至るまで日常生活の中で両方の形式に接することがあります。このような柔軟性は、文字の方向を変えることが読みの基本的な仕組みを変えるのか、あるいは眼と脳が両方の配列を大部分で同じように処理するのかを問う、研究者にとって稀な機会を提供します。

豊富なアイトラッキング・コーパスの構築
これらの問いを探るために、著者らはより大きな多言語視線運動コーパス(MECO)プロジェクトの一環として、双方向中国語MECOコーパスを作成しました。香港の大学生60名が、伝統中国語の解説文12編を読みました。これらは百科事典やウィキペディアの短い項目のような文体で、歴史や自然現象などの話題を扱っています。各参加者は6編を横書き、6編を縦書きで読み、同じ文が両方向で注意深く対応付けられました。参加者は理解のために黙読し、その間に高精度のアイトラッカーが視線の位置と滞在時間を記録しました。これにより、各語が何回注視されたか、眼がどれくらい留まったか、どれくらい後戻りしたかといった瞬時の測定が得られました。
視線運動が読むことについて示すもの
研究者らはアイトラッキングデータから技術的な誤差や異常な注視を除去し、語レベルで三万件を超える観測を得ました。そのデータセット全体と、付随するスクリプトや文書をMECOの他のリソースと互換性のある形式で公開し、世界中の研究者が言語間でデータを結合・比較しやすくしました。測定の信頼性はデータを異なる方法で分割して、同一の参加者や同一の語が一貫したパターンを示すかどうかを調べることで評価されました。参加者レベルでは信頼性は非常に高く、個々人の読む行動はテキストの異なる部分間で著しく安定していました。語レベルではやや低かったものの依然として強く、他言語の類似コーパスと同等の水準であり、詳細な解析に十分耐えうる堅牢さを示しています。
横書きと縦書き:異なるよりも似ている点が多い
続いて著者らは高度な統計モデルを用いて、視線運動に既知の影響がこの新しいコーパスでも現れるか、また文字方向で変化するかを検証しました。これまでの中国語研究と同様に、眼は長い語、出現頻度が低い語、画数の多い視覚的に複雑な語でより長く留まることが確認されました。これらのパターンは横書き・縦書きの両方で見られ、語の認識や視覚的詳細への対応といった基本プロセスが両レイアウトで共有されていることを示しています。縦書きではやや注視時間が長くなり、語長や視覚的複雑さの効果が強まる傾向があり、縦書きの文章は特に経験が少ない読者にとって視覚的負荷が若干大きくなる可能性を示唆します。ただし、全体的には類似点が差異よりもはるかに目立ちました。

読者と今後の研究にとっての意味
日常的な観点から見ると、この研究は伝統中国語に熟練した読者が横書きと縦書きを大まかに同等の効率で扱えることを示しています。どちらの書式でも、より難しいまたは複雑な語では眼の動きが予測可能な形で遅くなります。新しいコーパスは、他の研究者が読書中の視線運動理論を検証したり、異なる表記体系を比較したり、教育的または支援的なツールを設計したりするための豊富な公開資源を提供します。縦書きが複数のアジア言語や年配の中国語読者の間で依然一般的であることから、方向特有の経験が視線運動にどう影響するかを理解することは、さまざまな読者層にとってより読みやすくアクセスしやすい教材や介入の設計にも役立つでしょう。
引用: Pan, J., Xi, Y., Tan, D. et al. The Corpus of Bidirectional Reading of Traditional Chinese Text: An Extension of the Multilingual Eye-Movement Corpus. Sci Data 13, 628 (2026). https://doi.org/10.1038/s41597-026-06989-8
キーワード: アイトラッキング, 中国語の読解, 文字方向, 読書研究, 視覚的単語認識