Clear Sky Science · ja

甲骨文字情報処理:包括的な総説

· 一覧に戻る

古い骨、現代の問い

三千年以上前、中国の占い師たちは亀甲や牛骨に君主への問いを書き刻み、熱で割って吉凶を占いました。これらの甲骨文字は現存する最古の中国の文字であり、青銅器時代の政治、宗教、日常生活をうかがわせる稀有な窓口です。しかし今日では、骨は深刻に破損しており、文字は読み取りにくく、多くの字が未解読のまま残っています。本稿は、新たな人工知能の波がどのように学者の甲骨の洗浄、復元、解読、解釈の方法を変えつつあるか、そして依然として立ちはだかる課題を解説します。

Figure 1
Figure 1.

手と目からシリコンとコードへ

この一世紀の大半にわたり、甲骨はごく限られた専門家の手でしか研究されず、彼らは拓本や写し、写真を丹念に調べました。大部な印刷目録を編纂し、個々の字形の読みを提案し、銘文の年代測定や分類について議論しました。この作業が研究の基盤を築いた一方で、進行は遅く、再現が難しく、各研究者の記憶や判断に大きく依存していました。コンピュータの導入とともに、研究者は拓本をデジタル化し、コントラスト強調やエッジ検出といった基本的な画像処理を適用し始めました。これらの初期ツールは骨の可視化と共有を容易にしましたが、文字を意味を持つ記号としてではなく、単なる形状として扱っていました。

深層学習がアーカイブに踏み込む

深層学習の台頭が状況を一変させました。畳み込みニューラルネットワークやトランスフォーマーは、日常写真で鍛えられた後、ノイズの多い拓本上の文字を検出したり、文字を分類したり、かつて同じ骨だった破片を照合する補助をしたりするよう再訓練されました。データを大量に必要とするこれらのモデルに対応するため、研究チームは多数の専門的データセットを編成しました:拓本上のすべての文字を同定することに焦点を当てたもの、切り出した字形を分類するもの、部首や構成要素を結びつけるもの、古形式と後代の書体を対応づけるものなどです。それでもデータは史実を反映します:ごく一部の頻出する字が何千回も現れる一方で、稀な字や未解読の記号は一度しか出ないことが多い。研究者たちは巧みなデータ拡張、合成例を生み出す生成モデル、既知サンプルがわずかしかない—あるいはまったくない—場合でも文字を認識するような訓練スキームで対応しています。

視覚と意味を橋渡しする機械の教育

最新段階では、視覚と言語を組み合わせた大型のマルチモーダルモデルが甲骨に適応されつつあります。単に文字の位置を見つけるだけでなく、字形がどのような意味を持ちうるかを、人間の古文字学者のように結びつけようとするのです。新しいベンチマークは、こうしたモデルが文字を認識できるか、破片を再結合できるか、類似する銘文を検索できるか、もっともらしい読みを提案できるかを試します。ある枠組みは古い字形を直接現代中国語の字に写像し、何世紀にもわたる視覚的な変遷をたどろうとします;別のものは画像的な記号を実世界の物体の画像に結びつけ;さらに別は占辞の全文的な説明を試みます。エージェント風のシステムはさらに進み、複数のツールやデータベースを調整して、画像・転写・学術ノートを一つのワークフローで横断検索する手助けを行います。

Figure 2
Figure 2.

データ、評価、そして断片化した歴史の謎

急速な進展にもかかわらず、本総説は頑強な障害を浮き彫りにします。最良の画像コレクションや3Dスキャンの多くが博物館や私的アーカイブにあり公開されておらず、手法を公平に比較したり汎用的なモデルを訓練したりするのが困難です。公開データセットでさえ長尾分布、不一致なラベル、低い画質を抱えることが多い。物体検出や手書き認識から借用した標準的な性能指標は、歴史家にとって本当に重要な点、たとえばモデルが同一字の許容される異体を混同するか、提案された読みが記号の構成要素の仕方を尊重しているか、を必ずしも反映しません。人的評価も断片化しています:研究ごとに招かれる専門家の種類や問い掛けが異なり、他者が検証できるだけの詳細でテストを報告することは稀です。

古代文字と未来のAIが出会う場所

前進するために、著者らはより豊かで十分に文書化されたデータセット、ピクセルレベルの一致だけでなく構造的・意味的理解を評価する手法、技術者と初期中国文字の専門家とのより密接な協働を提唱します。彼らが思い描くのは、記述から甲骨風のリアルな字形を生成するテキスト→画像生成器、古代書体専用に訓練された基盤モデル、争点となる読みを議論・精練するマルチエージェントシステム、そして破損した骨の元の形状を復元する3D再構築などです。率直に言えば、記事の結論は、AIが単独で甲骨問題を「解決」するわけではないが、専門家の洞察を増幅し、膨大なアーカイブを検索可能にし、青銅器時代の声をより広い一般に開く強力なパートナーになりうる、ということです。

引用: Chen, Z., Hua, W., Li, J. et al. Oracle bone inscriptions information processing: a comprehensive survey. npj Herit. Sci. 14, 220 (2026). https://doi.org/10.1038/s40494-026-02511-w

キーワード: 甲骨文字, 古代中国の文字, デジタル・ヒューマニティーズ, 人工知能, マルチモーダルモデル