Clear Sky Science · fr

Prédiction des coûts de construction consciente de l’incertitude et explicable à l’aide d’un modèle d’apprentissage probabiliste hybride

· Retour à l’index

Pourquoi le prix d’un bâtiment compte avant sa construction

Avant qu’une pelle ne touche le sol, maîtres d’ouvrage et constructeurs doivent estimer combien un projet coûtera réellement. Si cette estimation est fausse, les budgets explosent, les calendriers dérapent et la confiance entre partenaires s’érode. Cet article présente une nouvelle méthode pour prévoir les coûts de construction qui cherche non seulement à être précise, mais indique aussi le degré de confiance de la prévision et explique pourquoi le modèle considère qu’un projet sera coûteux ou bon marché. Cette combinaison de précision, d’honnêteté sur l’incertitude et d’explications claires fait de ce travail un apport important pour quiconque s’intéresse à la façon dont les données et l’intelligence artificielle peuvent réduire les risques liés aux grands projets.

Figure 1
Figure 1.

Les limites des méthodes traditionnelles d’estimation des coûts

Depuis des décennies, les coûts de construction sont estimés à partir du jugement d’experts et de statistiques simples. Ces méthodes reposent largement sur des projets passés et l’expérience humaine. Elles sont faciles à comprendre, mais peinent lorsque les projets deviennent plus complexes, que les marchés sont volatils ou que de nombreux facteurs interagissent de façon intriquée. Les outils statistiques classiques supposent des relations linéaires entre les entrées et les coûts, alors que les projets réels sont affectés par des sauts des prix des matériaux, des choix de conception, les conditions du site et l’évolution des marchés du travail. Beaucoup de nouveaux modèles d’apprentissage automatique peuvent capturer ces schémas complexes, mais ils fonctionnent souvent comme des boîtes noires et produisent généralement une unique estimation ponctuelle, sans indiquer à quel point cette estimation peut être erronée.

Un nouveau modèle hybride pour des prévisions plus intelligentes

Les auteurs proposent un système d’apprentissage hybride appelé NGBoost‑ETR qui tente de résoudre trois problèmes à la fois : précision, incertitude et transparence. Au cœur se trouve une technologie connue sous le nom de Natural Gradient Boosting (NGBoost), conçue pour produire non seulement une estimation de coût, mais une courbe de probabilité entière autour de cette estimation. Plutôt que de dire « la dalle coûtera 17 dollars par pied carré », le modèle exprime en pratique : « 17 est la valeur la plus probable, mais voici à quel point elle pourrait raisonnablement être plus élevée ou plus basse. » Pour rendre NGBoost plus performant sur les données de construction, les auteurs remplacent ses arbres simples habituels par un apprenant d’arbres plus robuste appelé Extra Trees Regression, particulièrement apte à capturer les relations non linéaires entre des entrées telles que le type de dalle, la surface, les charges et les prix unitaires des matériaux.

Comment le modèle a été testé sur le terrain

Pour vérifier si l’approche fonctionne en pratique, les chercheurs ont entraîné et testé leur modèle sur 4 477 entrées réelles issues de RSMeans, une base de données américaine largement utilisée pour les coûts des composants de bâtiment. Chaque enregistrement décrit un assemblage de plancher structurel — comme des dalles unidirectionnelles, dalles plates ou dalles alvéolées — ainsi que sa surface, les charges attendues et le coût unitaire du béton et du coffrage. Les performances du modèle ont été comparées à 10 méthodes populaires d’apprentissage automatique et à 9 autres hybrides NGBoost. Les mesures d’exactitude standard ont montré que NGBoost‑ETR produisait certaines des meilleures prédictions ponctuelles, avec des erreurs moyennes très faibles sur des données non vues. Tout aussi important, l’équipe a évalué dans quelle mesure les intervalles prédits par le modèle correspondaient à la réalité, en utilisant une suite de six métriques d’incertitude qui jugent à la fois la fréquence à laquelle le coût réel tombe à l’intérieur de la bande prédite et la largeur de cette bande.

Figure 2
Figure 2.

Voir quels facteurs poussent le coût

Parce que les décideurs sont réticents à faire confiance à une boîte noire, les auteurs intègrent l’explicabilité à leur conception en utilisant SHAP, une technique moderne qui attribue à chaque entrée un score de contribution pour chaque prédiction. Cela permet aux utilisateurs de voir, par exemple, combien des prix élevés de coffrage, un type de dalle particulier ou une grande surface tributaire ont fait augmenter ou baisser une prévision pour un projet donné. Sur l’ensemble du jeu de données, le coût du coffrage apparaît comme le principal facteur influençant le coût total, suivi du type de dalle et de la surface. En reliant ces explications directement à l’estimation centrale du modèle, les praticiens peuvent vérifier si les prédictions concordent avec leur expertise et ajuster la conception ou les négociations en conséquence.

Ce que cela signifie pour les projets futurs

Globalement, le cadre NGBoost‑ETR offre des prévisions de coût très précises, des intervalles d’incertitude relativement serrés et bien calibrés, et une vision claire des variables les plus déterminantes. Certains modèles concurrents offraient une couverture légèrement supérieure des coûts réels, mais seulement en prédisant des intervalles irréalistiquement larges, peu utiles en pratique. Le nouveau modèle trouve plutôt un équilibre : il peut rater le coût exact un peu plus souvent qu’une méthode extrêmement conservatrice, mais lorsqu’il fournit un intervalle, celui‑ci est suffisamment compact pour éclairer la budgétisation, les appels d’offres et la planification des risques en conditions réelles. Pour un public non spécialiste, l’essentiel est que cette recherche fait passer la prédiction des coûts de construction du simple pari éclairé à une « prévision météo » des budgets de projet plus honnête et fondée sur les données — une prévision qui vous dit non seulement ce qui est probable, mais aussi à quel point nous en sommes sûrs.

Citation: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8

Mots-clés: prévision des coûts de construction, apprentissage automatique probabiliste, gestion des risques de projet, IA explicable, planification des infrastructures