Clear Sky Science · ja
ビジョントランスフォーマー — コルモゴロフ–アーノルドネットワークに基づく消費者向け表面ひび割れ分類モデル
日常の構造物におけるひび割れが重要な理由
道路、橋、建物の壁にできるひび割れは、髪の毛ほどの細さで始まっても、安全上の重大な危険や高額な修繕へと発展することがあります。今日でも多くのひび割れ検査は、クリップボードやカメラを持って人が巡回する方法に頼っており、遅く費用がかさみ、小さな欠陥や隠れた損傷を見落としやすいという問題があります。本稿は、コンクリートやアスファルトの表面ひび割れを非常に高精度で検出・分類しつつ、スマートフォン、ドローン、その他小型機器でも動作する効率性を備えた新しいコンピュータベースの手法を紹介します。これにより、日常的で低コストな構造物の監視が実現します。
手作業の点検からスマートカメラへ
目視による点検には明らかな欠点があります。判断が主観的になりやすく、時間がかかり、交通量の多い道路や高い橋で作業する検査員には危険が伴うこともあります。以前のコンピュータプログラムはエッジ検出や閾値処理などの単純な手法で写真からひび割れを見つけようとしましたが、影や光の変化、ひび割れに似た粗いテクスチャに悩まされていました。最近のシステムは機械学習を利用し、多数の画像からパターンを学習します。畳み込みニューラルネットワークや新しいビジョントランスフォーマーは精度を大幅に向上させましたが、現実世界の条件下での細く不規則なひび割れの扱いや、判断過程の説明性ではなお課題が残っています。

より明瞭に見るためのハイブリッドAIモデル
著者らは、複数の強みを一つのパイプラインに統合したハイブリッド深層学習モデルを設計しました。まず、MobileNet V3という小型ネットワークが画像を解析し、エッジ、マイクロクラック、テクスチャなどの局所的な詳細を抽出します。次に、LeViTと呼ばれるトランスフォーマーモデルが画像の各部分間の関係を分析し、薄いひび割れがスラブ上を蛇行するような長距離のパターンを捉えます。三つ目の要素は改良型Linformerトランスフォーマーで、高解像度画像における長距離関係を効率的にモデル化しつつ計算量を抑えるため、小型デバイスでの実用性を確保します。
信号を混ぜ合わせて最終判断へ
これらの要素を単に積み重ねるのではなく、システムは「ゲーテッド特徴融合」というステップを用いて、各ネットワークからの情報のうち本当に重要なものと冗長なものを学習的に選別します。これにより、ひび割れの幅、長さ、連続性に関する有益な手がかりを保持しつつ、背景の紛らわしいパターンを無視できます。融合された信号はコルモゴロフ–アーノルドネットワーク(Kolmogorov–Arnold Network)に渡されます。これは柔軟な数学的曲線を用いて複雑な関係を表現する特殊なニューラルネットワークで、データ中のパターンが微妙で乱れがあっても「ひび割れ」対「非ひび割れ」の鋭い境界を描くように調整されており、スマートフォンや組み込みボードなどのエッジハードウェアでのリアルタイム利用に耐えうる高速・コンパクトさを保ちます。

AIのブラックボックスを開く
インフラの安全性は信頼に依存するため、著者らはモデルの判断を理解可能にすることにも注力しています。SHAPとLIMEという二つの説明手法を適用し、ある予測に最も影響した画像領域や特徴を可視化します。モデルがひび割れを検出した際、これらの手法は通常、ひび割れの経路とその周辺を強調し、システムが汚れや影に惑わされずに正しい箇所を「見ている」ことを確認させます。開発過程では、これらの説明がアスファルト上の塗装線に反応しやすい傾向などの弱点を露呈し、訓練プロセスの調整や誤検知の削減につながりました。
性能と意義
コンクリートおよびアスファルトの大規模で多様な画像コレクション(複数の公開データセットからの4万枚以上の写真)で評価したところ、モデルは約99.5%の精度に達し、見たことのない新しい画像に対しても高い性能を維持しました。さらに、多くの競合手法よりも計算量とメモリ消費が少なく、消費者向け電子機器、ドローン、低コストの検査システムへの組み込みに適しています。これにより、住宅所有者、施設管理者、都市の技術者が、一般的なスマートカメラやモバイルアプリを用いて表面を継続的に監視し、初期のひび割れを検出して構造管理を希少な手作業からルーティンでデータ駆動の保守へと転換する可能性が広がります。
より安全な構造物に向けて
簡潔に言えば、本研究は、軽量なネットワーク、効率的なトランスフォーマー、先進的な分類器を慎重に組み合わせることで、なぜその判断に至ったのかを説明しつつ、ひび割れと健全な表面を信頼性高く区別できることを示しています。極端な照明条件や非常に限られたデバイス電力への対応など、依然として解決すべき課題はありますが、本研究は建物、橋、舗装が自動的に監視され、小さな欠陥が危険な故障に成長するのを防ぐ未来への道筋を示しています。
引用: Wahab Sait, A.R., Sankaranarayanan, S. & Yu, Y. Vision transformers- Kolmogorov–Arnold networks-based consumer driven surface cracks classification model. Sci Rep 16, 9183 (2026). https://doi.org/10.1038/s41598-026-40359-z
キーワード: インフラ監視, コンクリートのひび割れ, アスファルト舗装, ディープラーニング, コンピュータビジョン