Clear Sky Science · ja

華山岩絵画像修復のためのゲート付き注意多事前注入拡散モデル

· 一覧に戻る

古い断崖絵画に再び命を吹き込む

中国南部の左江華山岩画は、二千年以上前に描かれた広大な断崖ギャラリーです。今日では、これらの黄土色の人物や記号の多くが著しく色あせ、ひび割れ、または欠損しています。本論文は、高度な画像生成技術を用いてこうした壊れやすい芸術作品を仮想的に修復するデジタル手法を提示し、岩を直接触らずに慎重な保存、研究、公開鑑賞を支援することを目的としています。

Figure 1
Figure 1.

なぜこれらの断崖絵画が重要なのか

華山岩画は急斜面の河岸の断崖に沿って広がり、赤みの強い色調でしゃがむ人物像や儀礼の場面、その他の象徴的な形を描いています。これは中国南部と東南アジアで最も大規模かつ豊かな岩画複合体の一つであり、チワン(壮)族の文化遺産の重要な一部です。しかし、顔料は鉄を含む鉱物から作られており、雨風、微生物の発生、人の接触に非常に脆弱です。長年にわたり、色の退色、輪郭の破損、はく離、そして実際の描画モチーフと見分けにくいノイズ状の風化テクスチャが生じてきました。従来の手作業による修復は遅く、主観性が高く、再現が難しいため、このような大規模で脆弱な遺跡をスケールで保護するのは困難です。

インテリジェントな修復ができること

デジタル画像修復は、保存の最小介入の原則に従って仮想的に「欠損を埋める」方法を提供します。断崖を実際に描き直す代わりに、コンピュータが欠落部分であり得る形状やテクスチャを推定し、一貫性があり可逆的な結果を生成します。これらは高解像度のアーカイブに保存され、研究に用いられ、展示や没入型体験を通じて一般に共有できます。これまでの文化遺産に関する人工知能の研究は、主に損傷検出やモチーフのセグメンテーション、または形状やテクスチャがより規則的な壁画の修復に焦点を当ててきました。岩絵はより厳しい課題を呈します:意味は微妙な輪郭や象徴的な姿勢にあり、表面は著しく風化して不規則です。修復手法は元の形状を尊重しつつ、荒れた破損したテクスチャを信頼できるが過剰に創作しない方法で完成させる必要があります。

風化した岩面のための新しいデータセット

著者らはまず、華山岩絵修復専用の画像データセットを構築します。印刷された図譜や公開されているオンライン資料から528枚の候補画像を収集し、退色、はく離、境界のぼやけなどの明らかな劣化を伴う岩絵モチーフがはっきり見える177枚を慎重に選別して残しました。選択したすべての画像は共通の色フォーマットに変換され、512×512ピクセルにリサイズされ、主要な描画領域が中央に配置されます。制御された方法で修復手法を訓練・評価するために、各サンプルについて三つ組を生成します:(1) クリーンな参照画像、(2) ダメージを模した黒いパッチで画像面積の30〜65%をマスクした入力画像、(3) 欠損領域を示すマスク。これにより、異なる手法が基礎となる作品をどれだけ正確に再構築できるかをピクセルレベルで客観的に評価できます。

Figure 2
Figure 2.

形状と表面を尊重するモデルの教え方

論文の中核は拡散モデルに基づく修復フレームワークです。拡散モデルは、ノイズを多数の小さな除去ステップを通じて徐々に画像に変換する近年の生成手法の一群です。すべての視覚手がかりを一つの束として扱うのではなく、著者らは指導を二つの別個の「事前情報(プライア)」に分割します:一つは構造(エッジや筆致のような輪郭)を重視し、もう一つはテクスチャ(微細な粒状感や表面粗さ)を重視します。これらの事前情報は、ダメージ部分を除く可視部分から決定論的フィルタで算出され、特徴マップにエンコードされます。ゲート付き注意融合モジュールは各除去ステップで構造的ガイダンスとテクスチャガイダンスをどれほど信頼し、どの程度拡散過程に注入するかを決定します。初期段階では安定した輪郭により依存し、後半ではノイズが減るにつれて周囲の岩面と一致するテクスチャ詳細の再構築により注意を払います。

デジタル修復の性能はどの程度か

チームは華山データセットで手法を訓練・評価し、古典的なエンコーダ–デコーダネットワークから高度な生成手法や状態空間アプローチに至るまで幅広い既存の画像修復モデルと比較しました。誤差、鮮鋭度、構造類似性の標準的指標を用いると、本モデルは岩絵のテストセットにおいてすべてのベースラインよりもピクセルレベルの誤差が小さく、構造的一致が高い結果を示しました。アブレーション研究により、二枝の事前抽出とゲート付き注意融合という各構成要素がそれぞれ明確な改善をもたらすことが示されています。視覚的比較では、人間像や象徴的な輪郭の滑らかな継続と、修復領域が風化した背景とより自然に統合されている様子が確認できます。注意マップは、モデルが大きな領域を盲目的に塗り直すのではなく、欠損した境界、主要な記号輪郭、テクスチャの遷移領域に注目していることを示しています。

過去を守ることにとっての意義

専門外の読者にとっての主な結論は、この手法が古代の岩絵をデジタル修復する上でより慎重で解釈可能なアプローチを提供するという点です。形状と表面の手がかりを分離し、それらの影響を時間とともに調整することで、モデルは壊れた図像を再接続し欠損箇所を埋めながら、元の断崖の外観と素材感を保つことができます。著者らは、このシステムが専門家の判断を補助するツールであり代替ではないこと、より多様なデータと専門家による評価が必要であることを強調しています。それでも、本研究は危機に瀕した岩絵が物理的介入なしに視覚的なインパクトと文化的意味を保存したまま記録、研究、共有され得る未来を示しています。

引用: Zhao, T., Huang, L., Qi, X. et al. A gated-attention multi-prior injection diffusion model for Huashan rock art image restoration. Sci Rep 16, 10414 (2026). https://doi.org/10.1038/s41598-026-41226-7

キーワード: 岩絵修復, 文化遺産, 拡散モデル, 画像インペインティング, 華山絵画