Clear Sky Science · ja
陶器片認識におけるコントラスト学習による誤誘導特徴の緩和
壊れた土器が現代科学にとって重要な理由
一見すると、中国南部の7000年前の集落から出土した壊れた陶器の山は現代の人工知能とは無関係に思えます。しかし、これらの破片は新石器時代の人々の生活を理解する鍵であると同時に、現代の画像認識システムに潜む弱点を露呈します。本研究は高度な機械学習を用いて河姆渡(Hemudu)の陶器片を種類ごとに分類するとともに、多くのAIシステムに共通する問題、すなわち真に重要な手がかりではなく誤解を招く視覚的「近道」に依存してしまう傾向に対処しています。

古い土器が語る隠れた物語
河姆渡遺跡からは約40万点の陶器破片が出土しており、これは新石器時代の南中国における日常生活、技術、交易を再構成するための貴重な資源です。出土品は主に2種類の陶器に大別されます。砂を混ぜた砂混ぜ陶は砂や小石が詰まっており、密度が高く硬く、耐熱性に優れます。木炭混ぜ陶は焼けた植物質が混入しており、微細な気孔や灰のような痕跡を残して器を軽く滑らかにします。考古学者はこれらの種類を主に表面の質感や材料組成によって分類し、破片ごとの不規則な輪郭線では分類しません。分類作業を自動化できれば専門家の膨大な作業を節約できますが、コンピュータが専門家と同じ手がかりに注目する必要があります。
AIが間違った学びをするとき
研究チームは発掘現場で厳密に管理された画像コレクションを構築し、遮光テント内の一定照明と白背景で1,864片を撮影しました。驚くべきことに、初期の実験では標準的な深層ネットワークが破片の形状のみでかなり高精度に分類でき、二値化した輪郭画像だけでも高い性能を示しました。これに対して、縁を切り取って内部の表面質感だけを残すと精度は低下しました。つまりモデルは簡単だが信用できない近道を見つけていた――考古学者が破断の偶然とみなす特定の破片形状を手がかりにしてしまっていたのです。機械学習の観点では、破片の形状はデータセット内のラベルと相関するものの、基礎となるカテゴリと真に結びついていない“誤誘導特徴”として働いていました。
近道を超えて見るようモデルを教える
より意味のある手がかりにモデルを向けるため、研究者らはコントラスト学習に基づく学習戦略を設計しました。コントラスト学習はどの画像が「似ている」か「異なる」かをモデルに教える手法です。各陶器写真について、輪郭の多くが消えるようランダムに切り取ったバージョンを作成し、内部の表面は残しました。どちらの画像も同じ特徴抽出ネットワークに通し、その内部表現が互いに近づくよう学習を強制しました。同時に異なる陶器タイプの画像は特徴空間上で遠ざけられます。専用の“Triplet-center”損失関数は同一クラスの破片のクラスタを引き締め、砂混ぜと木炭混ぜのクラスタを分離しました。これは肉眼では非常に似て見えるテクスチャの場合でも有効でした。

学習をより安定で信頼できるものにする
この特徴空間を形成した後、研究者らはそれを固定し、その上で単純な分類器を訓練しました。トレーニングデータで極端に良いが新しいサンプルで性能が落ちる過学習の罠を避けるために、彼らは“フラッディング(flooding)”と呼ばれる手法を用いました。トレーニング誤差をゼロにまで下げるのではなく、損失を小さい非ゼロの水準に保つことで、モデルがより広く平坦な解の領域に落ち着きやすくなり、一般化性能が向上します。さらに色変化やぼかしなどの一般的なデータ拡張も多数試しました。テクスチャ情報を乱す変換は概して性能を下げる一方で、水平反転や精巧に調整したランダムクロップのように形状を乱す変換は、誤解を招く輪郭手がかりを無視させるのに有益でした。
考古学とAIにとっての意義
コントラスト学習、Triplet-center損失、フラッディングの組み合わせにより、このシステムは河姆渡陶器データセットで97.3%の精度に達し、いくつかの既存の画像認識モデルを上回りました。本手法は、物体の種類が新しい見慣れない背景で出現する別のベンチマークでも性能を向上させ、誤誘導相関に対抗する多くのビジョンシステムに役立つ可能性を示しています。考古学者にとって、こうしたツールは大量の破片の迅速で一貫した分類を可能にし、専門家が繰り返しのラベリングではなく解釈に専念できるようにします。一般読者への結論は明快です。壊れた器のギザギザした輪郭のような都合のよいが信頼できない近道をAIに見過ごさせることで、専門家の理解に近いかたちで世界を観察できるシステムを構築できるのです。
引用: Yu, X., Li, T., Song, Z. et al. Mitigating spurious features by contrastive learning in pottery sherd recognition. npj Herit. Sci. 14, 135 (2026). https://doi.org/10.1038/s40494-025-02170-3
キーワード: 河姆渡陶器, コントラスト学習, 誤誘導相関, 考古学的画像, 画像分類