Clear Sky Science · ja

双路多スケール全域注意モジュールによる唐時代長沙窯詩文陶磁器の筆者同定

· 一覧に戻る

陶に記された詩、人びとの物語

小さな唐代の陶壺や枕の表面には、1000年以上前に湿った釉薬の上に詩の優雅な一行が筆で記されていました。これらの短い詩は、その美しさだけでなく、書いた人物について何を教えてくれるかという点でも今日では貴重です。しかしこれまで、特定の銘文を特定の筆者に結びつける作業は、限られた専門家の訓練された目に頼るしかありませんでした。本研究は、現代の人工知能がこれら壊れやすい遺物に残された人の手跡を読み解く手助けになりうることを示し、初期中世中国の日常生活、労働、交易についての新たな窓を開きます。

Figure 1
Figure 1.

なぜこれらの壺が重要なのか

長沙窯は、繁栄した唐代に活躍し、彩色や絵付け、書や詩をあしらった華やかな陶磁器を生産しました。これらの品は初期の交易路に沿って広く流通し、文学や趣味を運ぶだけでなく実用の器としても用いられました。銘文は単なる文字だけでなく、筆致の勢いや個々の書き手の選択をも保存しています。しかし、残存する作品の多くは博物館や私的コレクションに散逸しており、高品質な画像は稀です。これら銘文の公開された標準化された画像データセットは存在せず、研究者が作品を比較したり、デジタル手法を検証したり、あるいは「一人の陶工兼書き手が複数の器の詩を書いたか」といった基本的な問いを立てることを難しくしていました。

唐代筆跡のデジタル図書館を構築する

これに対処するため、著者らはまず長沙陶磁器の刊行目録から新たな画像コレクションを編成しました。詩や短い書き込みを有する135点の個別遺物(主に注器、皿、枕)から慎重に1,865枚の一文字画像を抽出しました。銘文が曲面の陶器上にあるため、側面近くの文字は写真で歪んで見えることがあります。チームは特殊な画像セグメンテーションと面平坦化のプロセスを用いて曲面の歪みを補正し、汚れやひびを除去し、グレースケール化、リサイズ、雑音低減を行い、バリエーションを増やすために一部の画像をわずかに反転させました。その結果、長沙窯詩文筆跡に特化した初のデータセットが得られ、文字認識、書風分析、将来の多くの研究を支える資源となります。

ニューラルネットワークに書風を見せる

このデータセットを用いて、研究者らは二つの文字画像が同一人物によって書かれた可能性が高いかを判断するコンピュータビジョンシステムを設計しました。モデルは同じ処理を共有する二つの並列チャネルを通して文字のペアを取り込みます。基本的なフィルタ処理の後、両画像は筆の太さ、曲線、間隔など微妙な特徴のパターンを抽出する深層ニューラルネットワーク(ResNet-34)に通されます。システムの中核は新しい多スケール全域注意モジュールです。このモジュールは一つの固定された詳細度だけを見るのではなく、粗いレイアウトから細かな筆のうねりまで複数のスケールを同時に観察し、筆画の離れた部分同士がどのように関連するかを学習します。これらの視点を組み合わせることで、モデルは各筆者の書風の豊かな内部“指紋”を構築し、それら二つの指紋を比較して0から1の類似度スコアを出力します。

Figure 2
Figure 2.

システムを試験する

チームは複数の一般的なニューラルネットワークのバックボーンと注意機構を比較し、双路ネットワークと新しい注意モジュールの組み合わせが最良の性能を示すことを発見しました。認識精度は約97.9%に達し、単一スケールの注意モデルを明確に上回りました。アルゴリズムが何を学んだかを可視化するため、著者らはネットワークが最も“注目”する場所を示すヒートマップを作成しました。これらは筆画の折れや斜め左払いなど、筆圧やリズムが人ごとに異なる領域を強調しており、人間の鑑識家が注目する点とよく一致します。研究者らは次に単一の遺物内および異なる遺物間で大規模なバッチテストを行いました。単一の器内では、システムは一貫してすべての文字を高い類似度と判断し、各器の詩は複数人ではなく一人の筆者によって書かれたという考えを支持しました。

古代職人についての新たな手がかり

もっとも注目すべき結果は、モデルが異なるコレクションの作品を比較したときに得られました。七言絶句の恋愛詩が刻まれた二つの陶枕は、現在別々の機関に所蔵されているにもかかわらず非常に高い書風の類似性を示しました。考古学記録は両枕を同じ窯址に置き、その形状、装飾モチーフ、主題も密接に一致します。アルゴリズムによる「同一の手によるもの」という判定(85.8%の確率)は、両者が同一筆者によって作られたという結論を支持します。対照的に、類似した文言で後悔を警告する三つの酒注器は低い類似度スコアを示し、共通の文を写した三人の異なる書家を示唆しました。これらの発見は、AIの“眼”が作業場の組織、労働の分担、交易慣行をたどる助けになることを示しています。

過去と未来にとっての意義

精緻なデジタル撮影と高度なニューラルネットワークを組み合わせることで、本研究は陶器上の脆弱な墨痕を誰が何を書いたかについての定量的証拠に変えます。一般読者にとっての重要なポイントは、コンピュータビジョンが古代書法における個々の手跡を、ほぼ人間の専門家と同じくらい確実に、しかしはるかに速く、より多くの対象に対して識別できるようになったことです。これにより、世界中に散在する作品を結び付け、忘れられた職人の経歴を地図化し、唐代における大量生産と個人的表現の共存をよりよく理解することが可能になります。方法には限界があり、しばしば損傷した限られたデータに依存するものの、博物館や研究者にとって強力な新しいツールを提供し、他の多くの種類の歴史的筆跡解析へのAI応用のモデルとなります。

引用: Jiang, C., Li, M., Guo, Y. et al. Scribe identification for Tang Dynasty Changsha Kiln poetic ceramics via dual-path multi-scale global attention model. npj Herit. Sci. 14, 146 (2026). https://doi.org/10.1038/s40494-025-02152-5

キーワード: 古代の筆跡, 唐代陶磁器, 筆者同定, 深層学習, デジタル遺産