Clear Sky Science · ja
生成対向ネットワークを用いた甲骨文字解読への人間–コンピュータ協調アプローチ
古代の文字が現代の機械と出会う
三千年以上前、中国の占い師たちは戦争や天候、収穫に関する問いを亀甲や動物の骨に刻んだ。今日、これらの甲骨文字は中国の文字や初期社会の形成を理解するための重要な資料だ。しかし、多くの小さく風化した記号は未解読のままで、人間の専門家数人だけでは手が回らないほど数が多い。本論文は、研究者と協働する人工知能が、これら古いひっかき傷を現代の漢字風に変換することで解読を助ける方法を示している。
骨に刻まれた絵からコンピュータ用の画像へ
甲骨文字は視覚的要素が非常に強い。初期の書記は虎や太陽、人や道具の簡略化された図像を骨に直接刻んだため、各文字は小さな絵のようだ。著者らはこれを活かし、各文字をテキストではなく画像として扱う。彼らは千点以上の画像対を収集する:片方は撮影された甲骨の銘、もう片方はそれに対応する既知の現代漢字。これらの画像をリサイズし、クリーンアップすることで、コンピュータが学習できる標準化された画像ライブラリを構築し、古くからの解読という課題を現代の画像→画像変換問題に変換している。

二人のデジタル作家:補完し合うAIモデル
研究チームは、関連するが異なる2種類の生成対向ネットワーク(GAN)を訓練する。GANは「生成器」と「識別器」を競わせることでリアルな画像を生成するAIモデルだ。1つはPix2Pixと呼ばれる仕組みに基づくモデルで、対となる例から学ぶ:甲骨の文字を入力として、対応する現代文字を正確に示す例を与える。このモデルは期待される形に非常に近い、鮮明で整った現代風の字形を生成するのが得意だ。もう1つはCycleGANに基づくモデルで、必ずしも対が揃っていない場合でも機能するよう設計されている。こちらは甲骨文字の元の骨格や様式を保ちつつ、穏やかに現代的な形へ正則化する傾向がある。両者を併用することで、損傷した古い銘がより整った可読な形ではどう見えたかについて異なる「解釈」を提供する。
機械を検証し、代替手法と比較する
これらのシステムが単に見た目の良い画像を描いているだけではないかを確認するため、著者らは慎重なテストを行う。訓練中にAIに見せない160の既知の甲骨–現代対を保持し、各モデルに甲骨画像から現代文字を予測させる。そして出力を画像品質や構造の標準的な指標で既知の正解と比較し、視覚的にも結果を点検する。より広い比較では、彼らの2つのGANを拡散モデル、トランスフォーマー、古典的なU‑Netスタイルのネットワークなど他の一般的な画像手法と競わせる。GANの組み合わせが際立っている:Pix2Pixは最も明瞭で判読性の高い文字を生成し、CycleGANは保守的で構造を保つ代替案を提供する。他の手法はしばしば筆画をぼかしたり、文字の骨格を壊したり、もはや文字に見えない形状を生成したりしており、真面目な解読には向かないことが分かった。
人間を巻き込む:置き換えではなく協働
研究の核心はAI単独ではなく、機械と専門家の構造化された協働だ。意味が以前は不明だった150の銘について、モデルは複数の現代字候補を生成する。人間の専門家は有望な候補を選び、AIの示唆と文字史や銘文に反映された日常生活の知識に導かれながら、不足や不確かな筆画を手で再描画する。例えばある未知の銘を「洞穴」や「巣穴」を意味する可能性があると提案するなど、詳細なケーススタディでは、AI提案の形、関連文字との比較、古代の住居や儀礼に関する歴史的情報を組み合わせている。また160の既知例を用いた統制実験を行い、AI単独、人間が白紙から描く、人間がAIの草案を修正するという3つのモードを比較する。数値的な画像スコアや専門家パネルの評価の両面で、組合せアプローチは常に真の文字に近い画像を生成し、研究者の時間と労力を節約する効果も示した。

歴史と遺産にとってなぜ重要か
非専門家にとっても利得は明確だ:新たに解読された甲骨文字の一つ一つが、王室の祭祀から農耕や疾病に至る初期中国史の像を鋭くする。本研究は、AIが現代の手書き認識や芸術生成以上のことを成し得ることを示している。慎重な人間の判断と組み合わせることで、書かれた文化の最も初期の層を解き明かす手助けができるのだ。専門家を置き換えるのではなく、形を提案し、面倒な再描画を高速化し、過程をより透明かつ計測可能にする賢いアシスタントとして機能する。著者らは、この人間–コンピュータの協働が他の古代文字や損傷した文書にも応用され、骨や粘土、羊皮紙のかすかな痕跡を、人々がかつてどのように暮らし、信じ、世界を記録したかを伝える読める物語へと変える可能性があると論じている。
引用: Zeng, S., Bai, J., Shi, J. et al. Human–computer collaborative approach to the decipherment of racle bone inscriptions with generative adversarial networks. npj Herit. Sci. 14, 232 (2026). https://doi.org/10.1038/s40494-026-02509-4
キーワード: 甲骨文字, 古代文字, 文化遺産AI, 人間–AI協働, 漢字の進化