Clear Sky Science · ja
有効な連結成分制約を組み込んだ生成対向ネットワークによる栗葉(Liye)秦簡文字の修復
古の文字がよみがえる
紙が広まるずっと以前、中国の役人たちは細長い竹や木の札に筆で記した。栗葉(Liye)秦簡と呼ばれるこれらの脆い記録が、廃井から二千年以上の時を経て掘り出された。そこには初の統一中国帝国の日常的な命令や帳簿、報告が残されている。しかし水や泥、微生物の影響で多くの墨跡がにじんだり欠けたりしており、肉眼で読むには非常に手間がかかる。本研究は、現代の人工知能がこれら損傷した文字をデジタル上で「清掃」し、歴史家が遠い過去の声を取り戻す手助けができることを示す。
なぜ埋もれた記録が重要なのか
栗葉秦簡は王命や大きな碑文ではなく、行政の実務書類だ。3万点を超える札が、秦帝国の端の一県での税や労働、日常的な行政を記録している。乾いた墓で見つかる類似の札とは異なり、栗葉の断片は井戸底の湿った堆積物に埋もれていた。多くは反り、割れ、染みがあり、筆致はにじんだり消えかかっている。単一の出土品群を解読するだけでも専門家に何年もかかることがあり、発見が増える速度は人の目だけでは追いつかない。修復工程の一部を自動化すれば、研究が劇的に加速しつつ、各文字を可読にする微妙な形状を保存できる可能性がある。

損傷を見通すコンピュータの教育
著者らは修復を一種の画像翻訳として扱う:コンピュータは小さくノイズの多い文字画像を受け取り、それがもし清潔で鮮明だったらどのように見えるかを出力するよう求められる。そのために彼らは生成対向ネットワーク(GAN)というAIの一形式を基盤に構築する。あるネットワーク(「生成器」)は損傷した画像をクリアなものに変えようとし、別のネットワーク(「識別器」)は結果が本物の整った筆文字に見えるかを判定する。このやり取りを通じて生成器は批評を欺けるより説得力のある修復を徐々に学習する。
細い筆致への鋭い注意
背景がまだらで墨が薄い場合、従来の画像処理手法は竹の上の極めて細かい筆致を見落としがちだ。研究チームはGANの中核をU字型の設計(U-Net)で改良し、広い文脈情報とピクセルレベルの細部を両立させる。さらにこのネットワークの通常の構成要素を特別に設計した局所残差密集ブロック(Local Residual Dense Blocks)に置き換える。これらのブロックは有用なパターンの再利用を促しつつ、近接する筆線がぼやけてしまう過度の平滑化を避ける。ネットワーク中央の“ボトルネック”部を強化することで最も重要な特徴をさらに精緻化し、元の像が大きく劣化していても実際の筆致とノイズを区別するのに役立てている。
各文字の骨格を保つ
重要な革新は著者らが「有効連結領域(Effective Connected Domain)制約」と呼ぶ手法だ。すべてのピクセルを個別に評価する代わりに、この規則は文字中の主要な墨領域、つまりそれらの大きさと重心位置に着目する。モデルは出力画像中のこうした粗い“墨の島”を、専門家が丁寧に復元した参照画像のそれと比較し、文字の骨格を形成する最大いくつかの領域に特に注意を向ける。主要な筆画が欠けている、他と融合している、あるいは位置がずれている場合にはペナルティが与えられ、調整を迫られる。この単純な幾何学的チェックは、筆画が途切れたり縁が荒れていたり墨が滲んで背景に広がっている場合でも驚くほど安定して機能する。

デジタル修復の効果
適切なデータが存在しなかったため、チームは栗葉札から600枚の文字画像の対となるデータセットを独自に作成し、それぞれに専門家が苦心して作った復元画像を対応させた。このベンチマークで、彼らの手法は他の最先端手法(ほかのGAN、Transformerベースのモデル、拡散モデルなど)を三つの標準的な画像品質指標で上回った。視覚的な並列比較では、破断した筆画が少なく、近接する筆線の分離がより明瞭で、背景の乱れも減っている。ブラインドテストで結果を評価した書道の指導者たちは筆画の連続性、構造の正確さ、全体の可読性に高い評価を与え、別の試験ではモデルが単に訓練データを丸暗記しているわけではないことも示唆された。
埋もれた文字を再び焦点に戻す
専門外の読者にも明快な結論がある:古代文字の知見と特化したAI設計を組み合わせることで、かつて使い物にならないと思われた竹簡から可読な文字を復元することが可能になった。モデルは文字の存在だけでなく、筆画が空間的にどう関係するかを保持するため、出力は歴史家や語学研究者にとって有益だ。とはいえ手法は限られた訓練データに依存しており、絹や石材など他の材料への適用はまだ課題が残るが、多くのもろく読みにくい文書をデジタルで修復し、大規模に研究する未来への道を示している。それにより初期帝国の日常生活に新たな窓が開かれるだろう。
引用: Li, X., Huang, Y., She, S. et al. Restoration of Liye Qin slips characters using generative adversarial network with effective connected component constraint. npj Herit. Sci. 14, 194 (2026). https://doi.org/10.1038/s40494-026-02434-6
キーワード: 竹簡修復, 古代中国の写本, 生成対向ネットワーク, デジタル遺産保存, 手書き文字の復元