Clear Sky Science · pl
Świadome niepewności i wyjaśnialne przewidywanie kosztów budowy z wykorzystaniem hybrydowego probabilistycznego modelu uczenia
Dlaczego cena budynku ma znaczenie jeszcze przed jego budową
Zanim pierwsza łopata trafi w ziemię, inwestorzy i wykonawcy muszą oszacować, ile rzeczywiście będzie kosztować projekt. Jeśli to oszacowanie jest błędne, budżety zostają przekroczone, harmonogramy się opóźniają, a zaufanie między partnerami maleje. Artykuł przedstawia nową metodę prognozowania kosztów budowy, która nie tylko dąży do wysokiej dokładności, ale także informuje, jak pewne jest to prognozowanie i dlaczego model uważa, że dany projekt będzie drogi lub tani. Połączenie dokładności, uczciwości wobec niepewności i przejrzystych wyjaśnień czyni to rozwiązanie istotnym dla każdego, kto interesuje się, jak dane i sztuczna inteligencja mogą zmniejszać ryzyko dużych inwestycji.

Problemy z tradycyjnym szacowaniem kosztów
Przez dekady koszty budowy szacowano na podstawie wiedzy ekspertów i prostych metod statystycznych. Metody te opierają się w dużej mierze na doświadczeniu z przeszłych projektów i są łatwe do zrozumienia, jednak zawodzą, gdy projekty stają się bardziej złożone, rynki niestabilne, albo gdy wiele czynników wzajemnie się przeplata. Klasyczne narzędzia statystyczne zakładają liniowe zależności między wejściami a kosztami, mimo że rzeczywiste projekty są podatne na skoki cen materiałów, decyzje projektowe, warunki terenowe i zmiany na rynku pracy. Wiele nowszych modeli uczenia maszynowego potrafi uchwycić te złożone wzorce, ale często działają jak czarne skrzynki i zazwyczaj dają jedynie pojedyncze najlepsze oszacowanie, bez informacji o tym, jak bardzo to oszacowanie może się mylić.
Nowy model hybrydowy dla lepszych prognoz
Autorzy proponują hybrydowy system uczący o nazwie NGBoost‑ETR, który próbuje jednocześnie rozwiązać trzy problemy: dokładność, niepewność i przejrzystość. Jego rdzeniem jest technologia znana jako Natural Gradient Boosting (NGBoost), zaprojektowana tak, by zwracać nie tylko punktowe oszacowanie kosztu, lecz całą krzywą rozkładu prawdopodobieństwa wokół tego oszacowania. Zamiast mówić „płyta będzie kosztować 17 dolarów za stopę kwadratową”, model zasadniczo stwierdza: „17 jest wartością najbardziej prawdopodobną, ale oto jak bardzo realistycznie może być wyższa lub niższa”. Aby zwiększyć moc NGBoost na danych budowlanych, autorzy zastępują jego zwykłe proste drzewa silniejszym uczniem drzewiastym zwanym Extra Trees Regression, który szczególnie dobrze wychwytuje nieliniowe zależności między zmiennymi wejściowymi, takimi jak typ płyty, powierzchnia, obciążenia i jednostkowe ceny materiałów.
Jak model przetestowano w praktyce
Aby sprawdzić skuteczność podejścia w praktyce, badacze trenowali i testowali model na 4 477 realnych wpisach z RSMeans, szeroko stosowanej amerykańskiej bazy kosztów elementów budowlanych. Każdy rekord opisuje konstrukcyjny układ stropu — na przykład płyty jednoprzęsłowe, płyty płaskie czy płyty typu waffle — wraz z jego powierzchnią, przewidywanymi obciążeniami oraz jednostkowymi kosztami betonu i szalunków. Wydajność modelu porównano z 10 popularnymi metodami uczenia maszynowego oraz 9 innymi hybrydami NGBoost. Standardowe miary dokładności wykazały, że NGBoost‑ETR wygenerował jedne z najlepszych prognoz punktowych, z bardzo małymi średnimi błędami na niewidzianych danych. Równie ważne, zespół ocenił, jak dobrze przewidywane przedziały pasma odpowiadają rzeczywistości, używając zestawu sześciu miar niepewności, które oceniają zarówno to, jak często rzeczywisty koszt mieści się w przewidywanym paśmie, jak i to, jak wąskie jest to pasmo.

Widzenie, które czynniki napędzają koszty
Ponieważ decydenci są niechętni, by ufać czarnym skrzynkom, autorzy wplatają wyjaśnialność w projekt, korzystając z SHAP — nowoczesnej techniki przypisującej każdemu wejściu wkład w poszczególne prognozy. Pozwala to użytkownikom zobaczyć, na przykład, o ile wysokie ceny szalunków, konkretny typ płyty lub duża powierzchnia przysługująca zwiększyły lub zmniejszyły prognozę dla konkretnego projektu. W całym zbiorze danych koszty szalunków okazują się najważniejszym czynnikiem wpływającym na koszt całkowity, następnie typ płyty i powierzchnia. Powiązanie tych wyjaśnień bezpośrednio z centralnym oszacowaniem kosztów pozwala praktykom zweryfikować, czy prognozy zgadzają się z ich wiedzą dziedzinową i odpowiednio dostosować projekt lub negocjacje.
Co to oznacza dla przyszłych projektów
Podsumowując, ramy NGBoost‑ETR dostarczają bardzo dokładnych prognoz kosztów, stosunkowo wąskich, ale dobrze uformowanych przedziałów niepewności oraz jasnych wskazówek, które zmienne mają największe znaczenie. Niektóre konkurencyjne modele oferowały nieco wyższą pokrycie rzeczywistych kosztów, lecz jedynie przez przewidywanie nierealistycznie szerokich zakresów o niewielkiej praktycznej użyteczności. Nowy model natomiast znajduje kompromis: może nie trafiać co do joty częściej niż bardzo konserwatywna metoda, ale gdy podaje przedział, jest on na tyle zwarty, by służyć rzeczywistemu budżetowaniu, składaniu ofert i planowaniu ryzyka. Dla czytelników niebędących specjalistami najważniejszy wniosek jest taki, że badania te przesuwają prognozowanie kosztów budowy z poziomu wyważonych przypuszczeń w stronę bardziej uczciwej, opartej na danych „prognozy pogody” dla budżetów projektowych — takiej, która mówi nie tylko, co jest prawdopodobne, ale też, jak bardzo możemy być tego pewni.
Cytowanie: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8
Słowa kluczowe: prognozowanie kosztów budowy, probabilistyczne uczenie maszynowe, zarządzanie ryzykiem projektów, wyjaśnialna sztuczna inteligencja, planowanie infrastruktury