Clear Sky Science · ja
OBIMD: 甲骨文字の文脈的解釈のためのマルチモーダルデータセット
古い骨片に刻まれたメッセージを解き明かす
三千年以上前、中国の王室の占い師たちは動物の骨や亀の甲羅に霊に向けた問いを刻み、それを加熱して亀裂を生じさせました。これらの甲骨は世界でも最も古い完全な書記の一例を残していますが、今日では博物館や書籍に散在するもろい断片として保存されています。本研究はOBIMDを紹介します。これはこれらの刻印の画像と専門家による読みをまとめた新しいデジタルコレクションで、歴史家とコンピュータの双方に対して、この古代の文字がどのように機能し、初期中国社会について何を示しているかを研究する強力な手段を提供します。

なぜ古い骨は読みづらいのか
甲骨は整然としたページ状のテキストではありません。欠け、焦げ、しばしば破片に分かれており、文字は曲面に沿って不規則な方向に配置されています。研究者が原物に直接触れることは稀で、代わりに三種類の代替資料に依存します:骨の表面から取った濃い墨の拓本、筆画を明瞭にした手描きの複製図、そして専門家がどのように読むべきかを示す印刷された転写です。これまでの多くのデジタルコレクションは、拓本から切り出した単一の文字を個別の画像として扱ってきました。これは形状認識を学習させるには有用ですが、人間の専門家が実際に不明瞭なまたは損傷した字を解読する際に使う広い文脈を無視しています。
各刻字骨片の豊かなデジタル地図
OBIMDは各骨片をそれ自体が小さな構造化された世界であると扱うことで、この状況を変えます。著者らは一万を超える刻字について、対応する拓本と複製図を提供し、読み取れるすべての文字の位置をバウンディングボックスで示しています。さらに、骨が欠けて文字が明らかに失われている箇所には、特別な空のボックスをプレースホルダーとして配置しています。これらの文字と欠損は文やその他の機能的単位にまとめられ、しばしばループしたり非線形となる読み順も明示的にデータに書き込まれています。その結果、このデータセットは単に骨片にどのような形が現れているかを示すだけでなく、どのように文字が行を形成し、どの順序に従い、どこで文字が失われたのかを示します。

人間の専門知識と機械の助けを組み合わせる
何千件もの複雑な刻字に対してこのような詳細な地図を作成することは、人力だけでは不可能です。チームは、異なる訓練レベルの人々が効率的に協働できるウェブベースのプラットフォームを設計しました。まず、コンピュータビジョンツールが拓本と複製図を走査して、文字がありそうな場所と専門的文字ライブラリのどのエントリに似ているかを示します。その後、非専門の注釈者が画像を比較し、専門家の転写のスキャンページを参照してこれらの提案を精査します。甲骨学の訓練を受けた大学院生がその作業をレビューし、熟練した専門家が損傷が激しい字や読みが争われている難しいケースを解決します。この層状アプローチは品質を高く保ちながら、注釈という巨大な作業を実行可能にします。
古代文字を読むようにコンピュータを教える
OBIMDが何を可能にするかを示すために、著者らはこれを用いて、人間の専門家が骨を読む方法に触発された複数のタスクで現代の機械学習モデルを訓練・評価しました。あるモデルは、事前に切り出したパッチではなく全体画像上で直接文字を検出し識別することを学び、最もきれいな複製図で良好に動作し、雑音の多い拓本における微妙な変種で苦戦しました。別のモデルは位置と形状に基づいて文字を文にグループ化することを学び、主に成功したものの、文字列が重なった場合には境界を混同することがありました。三つ目のモデルは文中で無作為に並んだ文字の元の読み順を復元するよう訓練され、大部分の場合に正確な順序を当て、その他多くのケースでも近い順序を推測しました。これらのテストは総じて、OBIMDが進歩を促進するとともに、古代文字の自動読解に残る課題を浮き彫りにすることを示しています。
過去像にとっての意義
非専門家にとっての主要なメッセージは、OBIMDが散在しもろく残る初期中国の書記の痕跡を、整合性のあるコンピュータ可読な資源へと変えるという点です。画像、専門家の複製図、文レベルの読みを整合させ、残存するものだけでなく欠損も注意深くマークすることで、このデータセットは専門家が損傷した遺物から意味を組み立てるやり方を反映しています。これにより、言語変化、書記慣行、商(殷)代の王室生活に関する大規模な研究への門が開かれ、過去を読み解こうとする人工知能システムにとって厳しいテストベッドも提供されます。要するに、OBIMDは甲骨の翻訳ではありませんが、将来の歴史家やアルゴリズムがそれらを探検するために使う詳細な地図なのです。
引用: Li, B., Yang, J., Liang, Y. et al. OBIMD: A Multi-modal Dataset for Contextual Interpretation of Oracle Bone Inscriptions. Sci Data 13, 681 (2026). https://doi.org/10.1038/s41597-026-06967-0
キーワード: 甲骨文字, 古代の書記, デジタル人文学, マルチモーダルデータセット, AIによる文字認識