Clear Sky Science · ja

改良型トランスフォーマに基づく霧の深い道路シーンの画像予測アルゴリズム

· 一覧に戻る

霧を透かして見ることが重要な理由

濃い霧の中を運転するのは、白い壁を見つめているような感覚になります。人間のドライバーも自動運転車も、視界不良は平常の道路を危険な場所に変えてしまいます。本研究は、ぼやけた街路シーンをより鮮明で情報量の多い画像へと変換することで、コンピュータが霧越しに「よりよく見る」新しい方法を探ります。目的は単に見た目を良くすることではなく、車線や車両、障害物をあらゆる天候下で検出しなければならない自動車の安全な判断につなげることです。

ぼやけた道路からより明瞭な視界へ

霧は光を散乱させ、色を薄め、エッジをぼかし、遠方の物体を隠してしまうことで画像を劣化させます。従来の手法は、霧の振る舞いに関する手作りのルールに依拠したり、広範にコントラストを強調したりしてこれを逆転しようとしました。より新しい深層学習手法は改善をもたらしますが、遠方の車線や車両がカメラ近傍の情報とどう関係するかといった長距離のパターンを捉えるのが苦手なことが多く、またモデルが重く遅くなりがちで、リアルタイムで反応する必要のある車両には不向きです。

霧の道路向けの賢いビジョンエンジン

これらの限界に対処するために、著者らはもともと言語理解のために作られたが画像にも応用されている最新のAIアーキテクチャ、トランスフォーマに基づく専門的なビジョンシステムを設計しました。ネットワークは単一の霧のかかった道路画像を入力として、より明瞭な画像とともに視程(どれだけ先まで見えるか)の推定を出力します。画像を複数のサイズで重なり合う断片に分割することで、車線の端や交通標識といった細かなディテールと、道路の大局的な配置の両方に注目できます。これらの断片は複数の並列ブランチで処理され、それぞれ異なる霧の濃さに合わせて調整されるため、薄い霧と濃い靄が同じパイプラインに無理やり通されることはありません。

Figure 1
Figure 1.

ノイズではなく構造に従う

このシステム内での主要な革新は、画像の遠く離れた部分間の関係を計算量を爆発させずに重み付けできる、洗練された注意機構です。著者らは高コストな内部計算を近似して、類似の振る舞いを保ちつつ高速化し、二次的に増える遅いステップをはるかに効率的なものに変えました。これによりモデルは車線の整列や車両の輪郭といった重要な構造に集中し、ランダムな霧ノイズの多くを無視できます。さらに追加の注意モジュールがどの特徴チャネルが重要か、どの空間領域に注目すべきかを洗練させ、航行に重要なエッジや形状を一層鮮明にします。

実世界と合成霧での評価

研究者らは、コンピュータ生成の霧と都市や高速道路からの実世界の霧画像を混ぜた3つの道路シーンデータセットを用意し、軽度・中程度・濃霧をカバーしました。システムはデフォグ画像と視程推定の両方を生成するよう学習され、物理法則に基づく強力な手法や複数の主要なデヘイズモデルと比較されました。本手法は多くの場合でより多くの道路ディテール、特に遠方の車線マーカーや車両輪郭を回復し、人気のある代替案と比べてもはるかに少ないパラメータで動作します。重要なのは、現代の車に搭載されるようなグラフィックスハードウェア上でリアルタイム使用に十分な速度で動作し、高解像度でも毎秒数十フレームを維持できる点です。

Figure 2
Figure 2.

より安全な判断のためのより明瞭な画像

日常的に言えば、この研究は自動運転システムが悪天候下でより多くの道路情報を得られるようにする軽量の「デジタルデフォッガー」を提供します。完璧ではなく、非常に密な霧や複雑なシーンでは色のずれやアーティファクトが現れることもありますが、画質と速度の実用的なバランスを実現しています。マルチスケールの視点、異なる霧レベル向けの専門ブランチ、効率的な注意機構を組み合わせることで、車載コンピュータに負担をかけずにより明瞭で情報量の多い道路画像を提供し、人間と機械の双方が困難に直面するような視界の悪い条件での安全な自動運転に向けた有望な一歩となります。

引用: Zhang, BT., Zhao, AY. & Xiong, P. Image prediction algorithm for foggy road scenes based on improved transformer. Sci Rep 16, 9579 (2026). https://doi.org/10.1038/s41598-025-25974-6

キーワード: 霧の道路視覚, 画像デヘイズ, 自動運転, トランスフォーマベースの画像処理, 悪天候での知覚