Clear Sky Science · ja
クロスドメインのバイアス除去フーリエ融合とパラメータ化座標クエリに基づく簡牘文字復元手法
色あせた竹簡の文字をよみがえらせる
二千年以上にわたり、中国の役人や兵士、学者たちは薄い竹や木の短冊に筆を走らせてきました。今日、これらの壊れやすい「簡牘」は古代中国の政治、交易、日常生活に関するかけがえのない手がかりを伝えますが、文字は経年やカビ、損傷によってしばしば失われています。本論文は、これらの簡牘上の個々の字形をデジタルで復元する新たな人工知能(AI)技術を提示し、史料がほとんど読めない場合でも研究者が解読できるよう支援します。

なぜ古い竹簡は読みづらいのか
現代の印刷ページとは異なり、竹や木の短冊は繊維や汚れが交差する強いパターンのある表面を持ちます。我々が注目する墨の筆跡は細くかすれている一方で、背景の質感は太く不規則です。コンピュータから見ると背景の方が文字よりも目立つことがあります。カビの斑点は表面を滑らかに暗くし、ひび割れや欠損は文字の一部を完全に消してしまいます。通常の写真向けの画像修復ソフトは、これらの繊細な線をぼかしたり、偽のテクスチャを生成したり、背景ノイズを文字領域に流し込んでしまいがちです。
欠損筆画を狙い撃ちで再構築する
多くの復元手法は、完全に残っている領域であっても画像の全ピクセルを再生成しようとします。著者らは代わりに、損傷箇所とその周辺に処理を集中させるシステムを設計しました。まず「パラメータ生成」ネットワークが、欠損箇所を示すマスクとともにダウンサンプルされた損傷画像をスキャンし、穴および周辺文脈に特化したコンパクトな指示セット、つまりレシピを生成します。第二に「ピクセルクエリ」ネットワークは、このレシピと損傷領域内の各ピクセルの正確な座標を用いて、ピクセルごとに復元を行います。ネットワークが常に画像内で自分がどこを処理しているかを正確に把握しているため、高解像度でも筆画の端や接続部のような細部をより良く保持できます。
歪みなく空間と波(周波数)を融合する
複雑なパターンを理解・修復するために、この手法は画像平面上の形状だけに依存しません。フーリエ変換という数学的手法を用い、明暗の変化が異なるスケールにどう分布しているかも解析します。簡牘画像では、低周波は主に竹や背景の大まかな模様を記述し、高周波は文字の鋭い輪郭を捉えます。しかし、波数領域で一般的なニューラルネットワークの手法をそのまま使うと、スペクトルが乱れ、奇妙な色ブロックや背景パターンが筆画に流入することがあります。そこで著者らは、スペクトルを再配列して再中心化し、各周波数帯に学習可能な位置付けを与え、極端な値を穏やかに正規化する「バイアス除去(debiased)フーリエ」モジュールを導入しました。同時に、空間特徴(局所の形状やテクスチャ)と周波数特徴(全体的なパターンやノイズ統計)がクロスアテンションを通じて互いに影響を与え合うことで、損傷画像のより豊かで安定した記述を作り出す空間–周波数融合ブロックを組み込みます。

手法の検証
研究チームは数王朝にわたる竹簡・木簡から抽出した6万点以上の単字画像からなる大規模データセットを用意し、品質を厳しく精査して訓練・テストに分割しました。さらに、さまざまな種類の欠損(小さな欠け、大きな欠損、ひび割れ状のランダムな形状)を模した既存の人工欠損マスク群と、遺産資料以外への一般化性を評価するためのストリートビュー写真データセットも利用しました。幅広い評価において、本手法は主要なインペインティング手法7種よりも欠損領域を正確に復元し、画素精度、知覚的な鮮明さ、構造類似度の指標で高い得点を示しました。視覚的比較では、筆画がより清潔に再現され、モザイク状のアーティファクトが少なく、背景テクスチャからの汚染も抑えられており、カビや繊維模様が顕著な場合でも優れた復元が確認されます。
過去の文字を読み解くための意義
本研究は、古い竹簡・木簡のための専門的なデジタル「保存担当者」を提供します。脆弱な墨跡をノイズまみれで劣化した背景から分離する方法を学習し、空間的な形状と波状のパターンの相互作用を慎重に管理することで、専門家が納得できる形で文字の欠損部分を補填し、自動文字認識を支援します。依然として非常に大きな欠損や一部の複雑な書体には課題がありますが、本アプローチは古い簡牘上のかすれた断片を歴史学者や言語学者、一般の読者にとって可読で解析可能なテキストへと変える重要な一歩を示しています。
引用: Lu, Z., Wang, T., Hu, X. et al. A JianDu character restoration method based on cross-domain debiased fourier fusion and parameterized coordinate query. npj Herit. Sci. 14, 159 (2026). https://doi.org/10.1038/s40494-026-02414-w
キーワード: 簡牘復元, 古代漢字, 画像修復(インペインティング), フーリエに基づく深層学習, デジタル文化遺産