Clear Sky Science · it
Previsione dei costi di costruzione consapevole dell’incertezza e spiegabile mediante un modello di apprendimento probabilistico ibrido
Perché il prezzo di un edificio conta prima ancora che venga costruito
Prima che la prima pala tocchi il terreno, committenti e costruttori devono prevedere quanto costerà realmente un progetto. Se questa stima è sbagliata, i budget saltano, i tempi si dilatano e la fiducia tra i partner si erode. Questo articolo presenta un nuovo modo di prevedere i costi di costruzione che non solo mira alla precisione, ma informa anche sul grado di fiducia nella previsione e sul perché il modello ritiene che un progetto sarà costoso o economico. Questa combinazione di accuratezza, onestà riguardo all’incertezza e spiegazioni chiare rende il lavoro rilevante per chiunque voglia capire come dati e intelligenza artificiale possano ridurre i rischi dei grandi progetti.

I limiti dei metodi tradizionali per stimare i costi
Per decenni i costi di costruzione sono stati stimati usando il giudizio di esperti e statistiche semplici. Questi metodi si basano molto sui progetti passati e sull’esperienza umana. Sono facili da comprendere, ma faticano quando i progetti diventano più complessi, i mercati sono volatili o molti fattori interagiscono in modi intricati. Gli strumenti statistici classici assumono relazioni lineari tra input e costi, nonostante i progetti reali siano influenzati da salti nei prezzi dei materiali, scelte progettuali, condizioni del sito e mercati del lavoro in evoluzione. Molti modelli più recenti di machine learning possono catturare questi schemi complessi, ma spesso agiscono come scatole nere e tipicamente forniscono una singola stima, senza indicare quanto questa possa essere errata.
Un nuovo modello ibrido per previsioni più intelligenti
Gli autori propongono un sistema di apprendimento ibrido chiamato NGBoost‑ETR che cerca di affrontare tre problemi contemporaneamente: accuratezza, incertezza e trasparenza. Al suo interno c’è una tecnologia nota come Natural Gradient Boosting (NGBoost), progettata per produrre non solo una stima del costo, ma un’intera curva di probabilità attorno a quella stima. Invece di dire “la soletta costerà 17 dollari per piede quadrato”, il modello sostanzialmente afferma: “17 è il valore più probabile, ma ecco quanto potrebbe realisticamente essere più alto o più basso”. Per rendere NGBoost più efficace sui dati di costruzione, gli autori sostituiscono i suoi alberi semplici usuali con un learner ad alberi più potente chiamato Extra Trees Regression, particolarmente capace di catturare relazioni non lineari tra input come tipo di soletta, superficie, carichi e prezzi unitari dei materiali.
Come il modello è stato testato sul campo
Per verificare se l’approccio funziona in pratica, i ricercatori hanno addestrato e testato il loro modello su 4.477 voci reali tratte da RSMeans, un database di costi statunitense largamente utilizzato per componenti edilizi. Ogni record descrive un’assemblea strutturale del solaio—come solette unidirezionali, solette piane o solette alveolari—insieme alla sua area, ai carichi attesi e al costo unitario di calcestruzzo e casseforme. Le prestazioni del modello sono state confrontate con 10 metodi popolari di machine learning e 9 altri ibridi NGBoost. Le misure di accuratezza standard hanno mostrato che NGBoost‑ETR ha prodotto alcune delle migliori previsioni puntuali, con errori medi molto piccoli su dati non visti. Altrettanto importante, il team ha valutato quanto bene gli intervalli previsti dal modello corrispondessero alla realtà, usando una serie di sei metriche di incertezza che giudicano sia la frequenza con cui il costo reale ricade all’interno della banda prevista sia quanto stretta sia quella banda.

Quali fattori guidano il costo
Poiché i decisori esitano a fidarsi di una scatola nera, gli autori integrano la spiegabilità nel progetto usando SHAP, una tecnica moderna che assegna a ogni input un punteggio di contributo per ogni previsione. Questo permette agli utenti di vedere, per esempio, quanto prezzi elevati delle casseforme, un particolare tipo di soletta o una vasta area tributaria abbiano spinto una previsione verso l’alto o verso il basso per un singolo progetto. Nell’insieme del dataset, il costo delle casseforme emerge come il fattore singolo più influente sul costo totale, seguito da tipo di soletta e area. Collegando queste spiegazioni direttamente alla stima centrale del costo del modello, i professionisti possono verificare se le previsioni sono coerenti con la loro conoscenza del settore e adeguare di conseguenza progettazioni o trattative.
Cosa significa questo per i progetti futuri
Complessivamente, il framework NGBoost‑ETR fornisce previsioni dei costi altamente accurate, intervalli di incertezza relativamente ristretti ma ben comportati e chiara comprensione delle variabili più rilevanti. Alcuni modelli concorrenti offrivano una copertura leggermente maggiore dei costi reali, ma solo predicendo intervalli irrealisticamente ampi di scarso valore pratico. Il nuovo modello invece trova un equilibrio: può mancare il costo esatto leggermente più spesso rispetto a un metodo estremamente conservativo, ma quando fornisce un intervallo quel range è sufficientemente compatto da informare budgeting realistici, offerte e pianificazione del rischio. Per i lettori non specialisti, la conclusione chiave è che questa ricerca sposta la previsione dei costi di costruzione dal mero azzardo basato sull’esperienza verso una sorta di “previsione meteorologica” dei budget di progetto più onesta e guidata dai dati—che non dice solo cosa è probabile che accada, ma anche quanto possiamo esserne sicuri.
Citazione: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8
Parole chiave: previsione dei costi di costruzione, apprendimento automatico probabilistico, gestione del rischio di progetto, IA spiegabile, pianificazione delle infrastrutture