Clear Sky Science · ja

ハイブリッド確率学習モデルを用いた不確実性対応かつ説明可能な建設費予測

· 一覧に戻る

着工前に建物の価格が重要な理由

シャベルが地面に入る前に、発注者や施工者はプロジェクトが実際にどれだけ費用がかかるかを見積もらなければなりません。その見積りが誤っていると、予算超過や工期遅延が発生し、関係者間の信頼が損なわれます。本論文は、精度を目指すだけでなく、予測の確信度(不確実性)と、なぜそのプロジェクトが高価または低価になるとモデルが判断したのかを示す新しい建設費予測手法を紹介します。精度、不確実性の正直な提示、明瞭な説明を兼ね備える点が、本研究を大規模プロジェクトをよりリスク低減するためにデータと人工知能を活用する人々にとって重要にしています。

Figure 1
Figure 1.

従来のコスト見積りの問題点

何十年にもわたり、建設費は専門家の判断や単純な統計手法で見積られてきました。これらの方法は過去のプロジェクトや人間の経験に強く依存しており、理解しやすい反面、プロジェクトが複雑化したり、市場が変動したり、多くの要因が複雑に相互作用する場合には苦戦します。古典的な統計手法は入力とコストの直線的な関係を仮定しがちですが、実際のプロジェクトでは材料価格の急騰、設計選択、現場条件、労働市場の変化などが影響します。近年の多くの機械学習モデルはこうした複雑なパターンを捉えられますが、しばしばブラックボックス的であり、通常は単一の最良推定値のみを出力し、その推定がどれほど誤っている可能性があるかを示しません。

より賢い予測のための新しいハイブリッドモデル

著者らは、精度、不確実性、透明性という3つの課題に同時に取り組むハイブリッド学習システムNGBoost‑ETRを提案します。その中核にはNatural Gradient Boosting(NGBoost)という技術があり、単にコストの推定値を出すだけでなく、その推定値の周りの確率分布全体を出力するよう設計されています。モデルは「スラブのコストは1平方フィートあたり17ドルだ」と断定する代わりに、「17が最もあり得る値だが、実際にはこれだけ上下する可能性がある」と示します。建設データでNGBoostの性能を高めるために、著者らは通常の単純な木を、Extra Trees Regressionというより強力な木ベース学習器に置き換えています。これはスラブ種別、床面積、負荷、材料単価などの入力間の非線形関係を捉えるのに特に優れています。

実際のデータでのモデル検証方法

手法の実用性を確かめるため、研究者らは米国で広く使われている建築部材のコストデータベースRSMeansから4,477件の実データを用いてモデルを学習・検証しました。各レコードは片持ちスラブ、フラットスラブ、ワッフルスラブなどの構造床組成と、その面積、想定荷重、コンクリートや型枠の単価を記述しています。モデルの性能は、10の一般的な機械学習手法と9つの他のNGBoostハイブリッドと比較されました。標準的な精度指標では、NGBoost‑ETRは見えないデータに対して非常に小さい平均誤差で優れた点推定を示しました。同様に重要なのは、予測された範囲が実際とどれだけ一致しているかを評価するために、実際のコストが予測帯に含まれる頻度とその帯の幅の両方を判定する6種類の不確実性指標を用いた点です。

Figure 2
Figure 2.

どの要因がコストを左右するかを可視化する

意思決定者はブラックボックスを信用しにくいため、著者らはSHAPという手法を用いて説明可能性を組み込みました。SHAPは各入力が個々の予測にどれだけ寄与したかを示すスコアを割り当てます。これにより、例えば高い型枠価格、特定のスラブ種別、大きな分担面積がある特定プロジェクトの予測をどれだけ押し上げたり押し下げたりしたかを確認できます。データ全体を通して、型枠コストが総コストに最も影響する要因として浮かび上がり、次いでスラブ種別と面積が続きます。これらの説明をモデルの中心的なコスト推定に直接結びつけることで、実務者は予測が自らの専門知識と整合するかを検証し、設計や交渉を調整できます。

今後のプロジェクトにとっての意義

総じて、NGBoost‑ETRフレームワークは高精度なコスト予測、比較的狭くかつ挙動の良い不確実性範囲、そして重要な変数に関する明確な洞察を提供します。競合する一部のモデルは真のコストをより高い割合で覆うことがありましたが、それは実務にほとんど役立たないほど非現実的に広い予測帯を出しているために達成されていました。本モデルはその代わりにバランスを取っており、非常に保守的な手法より正確なコストを逃す頻度はやや高くなるかもしれませんが、予測帯を示した場合、その幅は現実の予算編成、入札、リスク計画に役立つ十分に狭いものです。一般読者への要点は、本研究が建設費予測を単なる経験則から、起こりうることだけでなくどれだけ確信できるかも示す、より誠実でデータ駆動型の“予報”へと近づけたことです。

引用: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8

キーワード: 建設費予測, 確率的機械学習, プロジェクトリスク管理, 説明可能なAI, インフラ計画