Clear Sky Science · ja
ドメイン知識を組み込んだ視覚言語モデルによる、ドレイジトラックの動力系と貨物分類を用いた持続可能な貨物輸送
よりクリーンな港、より賢いトラック
港は店舗の在庫となる貨物を運ぶ一方で、ターミナルの出入りを短距離で行き来する短距離輸送用トラック(ドレイジトラック)は主要な汚染源でもあります。本研究は、新しい種類の人工知能が路側カメラの映像を使ってこうしたドレイジトラックを監視し、手作業で画像ラベルを付けることなく、どれが依然としてディーゼルを燃やしているか、あるいはよりクリーンな技術を使っているかを自動で判別できることを示します。この種の自動化された知見は、規制当局、計画担当者、地域コミュニティが世界で最も忙しい港の周辺における大気浄化の進捗を追跡するのに役立ちます。
なぜ港湾トラックが気候と健康に重要なのか
米国では輸送部門が温室効果ガス排出の最大の単一源であり、重量級トラックは台数の割に多くの排出を占めています。この状況は米国コンテナ輸入の約40%を扱うロサンゼルス港とロングビーチ港の周辺で特に顕著で、両港は南カリフォルニアで最大の固定的な大気汚染源でもあります。港、鉄道ヤード、倉庫間でコンテナを運ぶドレイジトラックは、比較的短く予測可能なルートを走行するにもかかわらず多くの汚染を生み出します。そのためカリフォルニア州は、2035年までに港湾ドレイジトラックをすべてゼロエミッションとし、従来のディーゼルに代えてバッテリー電気、燃料電池(水素)、あるいはよりクリーンなガス技術を採用するよう命じています。

トラックの動力と積荷を見分ける
こうした政策が機能しているかを知るには、実際にどのようなトラックが港門や幹線道路に来ているのかを測る必要があります:ディーゼルか電気か?満載のコンテナか、空のシャーシか、そもそもトレーラーがないか?従来はこうした問いに答えるために大規模で手作業でラベル付けされた画像コレクションを作り、タスク固有のモデルを訓練する必要がありました。著者らはZeroDrayと呼ぶ別の方法を提案します。これは視覚と言語の両方を理解するAI(視覚言語モデル)を追加訓練なしで用いるアプローチです。モデルにはロサンゼルスとロングビーチ港に接する回廊で路側カメラに映った通過トラックの画像が与えられ、動力系(ディーゼル、電気、圧縮天然ガス、または水素)と積荷構成(単一の20フィートコンテナ、より長い40フィート相当、空のシャーシ、あるいはトレーラーのないボブテイル)を分類することが求められます。
トラックの専門家のように考えさせる教育
そのままでは視覚言語モデルはジェネラリストであり、インターネット上の幅広い知識は持っているものの、ドレイジ輸送のようなニッチな分野の深い知識は欠けています。ZeroDrayは専門家のヒントを符号化した慎重に作られたプロンプトをモデルに与えることでこのギャップを埋めます。動力系向けのプロンプトは、ディーゼルなら排気筒や大型燃料タンク、CNGならシリンダータンク、燃料電池車なら水素タンク、電気トラックなら排気装置の不在やEVバッジといった視覚的手がかりを記述します。貨物についてはシーンの幾何学を推論させます:コンテナの長さは高さやキャブの長さより明確に長いか(長い40フィート相当)、それともより近いサイズか(短い20フィートコンテナ)。AIにこれらの手がかりを段階的に検討させ、平易な言葉で理由を説明させることで、判断の透明性を高め確認が容易になります。

実際の港湾交通でシステムを検証
研究者らはZeroDrayを、2025年2月の2日間に亘り港の近くの固定路側カメラで撮影された443枚のトラック画像で評価しました。人間の観察者が各トラックの動力系と貨物構成についての正解ラベルを付与しました。次にZeroDrayを、同じ基礎モデルに対してクラス名だけを簡潔に与えた単純な設定と比較しました。最小限の指示でも基本システムは、トレーラーのないディーゼルトラックのような明快なケースを認識しましたが、微細な視覚差や空間的配置に依存する区別では大きく苦戦し、ディーゼルと電気のトラクタを混同したり短いコンテナと長いコンテナを取り違えたりしました。専門家情報に基づく視覚手がかりと空間ルールを追加すると精度は劇的に向上しました。動力系分類はディーゼル、電気、水素、CNGでほぼ100%に達しました。貨物認識、特に単一と二重相当長の区別は約半分の正答率からおよそ98%へ改善しました。全体として11の組み合わせ動力系–貨物カテゴリで強化されたZeroDrayは平均F1スコア99%を達成し、基本的な手法を大きく上回りました。
よりクリーンな貨物回廊への示唆
専門外の読者にとっての主要な結論は、適切な専門家の手がかりで導かれた汎用AIが、費用のかかるカスタム訓練なしに道路映像を「見て」トラックの積載状況だけでなく動力源まで信頼して判定できる可能性があるということです。その能力は、港湾当局や規制当局がディーゼルからゼロエミッションのドレイジトラックへの移行を監視し、新たな充電や水素ステーションが最も必要とされる場所を見極め、無駄な空走行を減らすための強力な新ツールとなり得ます。本研究は単一カメラによる限られたデータセットと理想的な条件での実証に基づいていますが、著者らは同じ戦略が他の貨物ハブや多様な環境へ拡張可能であると主張します。責任ある規模拡大がなされれば、ZeroDrayのようなシステムは貨物活動の見えにくい詳細を可視化し、コミュニティや政策決定者が貨物回廊をよりクリーンで効率的に運営する手助けになるでしょう。
引用: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4
キーワード: ゼロエミッション車両(トラック), 視覚言語モデル, 港湾ドレイジ, 貨物排出量, 持続可能な輸送