Clear Sky Science · ja
ConvNeXt V2 EMA注意機構とWIoU v3損失を用いた建設廃棄物検出のための深層学習
なぜ建設系残土の賢い仕分けが重要なのか
新しい建物、改修、解体のたびに大量の瓦礫—破砕されたコンクリート、レンガ、タイル、木材、発泡材など—が発生します。これらの多くは再利用可能であるにもかかわらず、手作業での仕分けは遅く高コストでミスが生じやすいため、埋立地に埋められてしまうことが少なくありません。本研究は、高度な人工知能が画像からさまざまな種類の建設廃棄物を自動認識・仕分けできるかを検証し、都市の汚染削減、原材料の節約、建築資源の真の循環利用に近づくための手助けとなる可能性を探ります。
瓦礫、資源、そして増え続ける世界的課題
建設・解体廃棄物は現在、世界で最も急速に増加している廃棄物の一つで、年間約十億トンが生成されます。これらの瓦礫は土地を消費し、土壌や水の汚染を招くリスクがあり、本来は製造時にエネルギーと排出を要した資源を無駄にしています。今日の処理は依然として埋立や山積みに依存しています。コンクリートとレンガ、タイルと木材、あるいは発泡材と石膏ボードを迅速に識別できる自動視覚システムがあれば、リサイクル率は大きく改善されるでしょう。しかし実際の現場は混沌としており、物体が重なり合い、粉塵に覆われ、似た色や質感を持つため、確実な自動認識は難しい課題です。

コンベヤ上の廃棄物に対する新しいデジタル“目”
著者らはYOLO系のリアルタイム視覚モデルを基にした専用の物体検出システムYOLO‑CEWを提案します。キプロスのリサイクル施設で撮影された1,774枚の専門データセットに基づき学習させ、コンクリート、レンガ、タイル、石膏ボード、木材、発泡材の6つの一般的カテゴリで1万1千点以上のラベル付き個体を含みます。過学習を避けるために画像は訓練、検証、テストに分割され、結果の頑健性を確かめるために異なるランダム初期化で複数回実行されています。目標はコンベヤのような動くライン上でも十分に高速で動作させつつ、各破片の検出とラベリング精度を大幅に向上させることです。
AIがより細かく観察し、誤りから学ぶ工夫
YOLO‑CEWはベースのYOLOv8モデルに対して主に3つの改良を加えています。第一に、選択した段階で新しい特徴抽出バックボーンConvNeXt V2を導入し、タイルとコンクリートを区別するような微細な視覚差を捉えやすくしつつ、処理速度を過度に落とさないようにしています。第二に、Efficient Multi‑scale Attention(EMA)モジュールを追加し、異なるスケールにわたって最も情報量の多い領域にネットワークが注目するよう促すことで、大きなスラブと小さく部分的に隠れた破片の双方をより確実に検出し、背景ノイズを無視する能力を高めています。第三に、学習時の損失関数にWIoU v3を採用し、非常に悪いバウンディングボックス推定の影響を軽減して、有望なサンプルに学習を集中させることで、ノイズあるサンプルに惑わされず実物の周りにボックスをより正確に収束させます。

現実的な条件でモデルを試す
建設廃棄物データセット上で、YOLO‑CEWは精度(precision)96.84%、再現率(recall)95.95%、および全体的な検出スコア(mAP@50)98.13%を達成し、いずれも元のYOLOv8ベースラインを上回りました。実務的には、見逃しが少なく誤検出も減ることを意味します。特にタイルや発泡材といった判別の難しいクラスに強みを見せますが、粉塵で境界があいまいになるとレンガとコンクリートの混同行は残ります。重要なのは、システムが約128フレーム/秒で動作し、リアルタイム監視に十分な速度を大きく上回っている点であり、稼働中の選別ラインでの活用に適しています。ブートストラップ手法による統計検定は、これらの向上が単なる偶然ではないことを裏付けます。複数のYOLO派生モデルとの比較でも、YOLO‑CEWは精度で一貫して優位を保ち、速度と性能のバランスも良好でした。
一つの工場を超えて:他の廃棄物流にも適応できるか
手法の汎用性を評価するため、研究者らは家庭ごみ(プラスチック、ガラス、段ボールなど)を含む公開のごみ検出データセットでもYOLO‑CEWを試しました。特別にこの用途向けに設計されていなくても、モデルは標準のYOLOv8を精度、再現率、全体的な検出品質で上回りました。これは、より良い特徴抽出、賢い注意機構、そして不良な学習例の扱い方の改善というアーキテクチャ上の改良が、家庭ごみの仕分けやドローンによるごみ検出など、他のリサイクル・環境監視タスクにも再利用可能であることを示唆します。
よりクリーンで賢い都市に向けての意義
非専門家向けの要点は、YOLO‑CEWが建設瓦礫に対してはるかに高精度で目の鋭いカメラシステムのように振る舞うということです。流れてくる瓦礫を観察し、個々の物体を認識してその材質を非常に高い信頼性と速度でラベル付けできます。これにより、機械が材料を埋めるのではなく再利用のために分別・振り分ける自動ラインの設計が格段に容易になります。極度の混雑や粉塵、稀な材料への対処など課題は残るものの、精緻に調整された深層学習モデルが今日の「廃棄物」を明日の資源ストリームへと変え、より環境に優しい建築と賢い都市づくりを支える可能性を示しています。
引用: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3
キーワード: 建設廃棄物, リサイクルAI, 物体検出, スマートシティ, 深層学習