Clear Sky Science · pt

Previsão de custos de construção com consciência de incerteza e explicabilidade usando um modelo híbrido de aprendizado probabilístico

· Voltar ao índice

Por que o preço de um edifício importa antes de ele ser construído

Antes que a primeira pá toque o solo, proprietários e construtores precisam estimar quanto um projeto realmente vai custar. Se essa estimativa estiver errada, os orçamentos estouram, os cronogramas atrasam e a confiança entre as partes se deteriora. Este artigo apresenta uma nova forma de prever custos de construção que não só busca ser precisa, como também informa o grau de confiança da previsão e por que o modelo considera um projeto caro ou barato. Essa combinação de precisão, transparência sobre a incerteza e explicações claras é o que torna este trabalho relevante para quem se interessa por como dados e inteligência artificial podem reduzir riscos em grandes empreendimentos.

Figure 1
Figure 1.

O problema com as estimativas tradicionais de custo

Por décadas, custos de construção foram estimados usando o julgamento de especialistas e estatísticas simples. Esses métodos se baseiam fortemente em projetos anteriores e na experiência humana. São fáceis de entender, mas apresentam dificuldades quando os projetos ficam mais complexos, quando os mercados são voláteis ou quando muitos fatores interagem de forma complicada. Ferramentas estatísticas clássicas assumem relações lineares entre entradas e custos, mesmo que projetos reais sejam afetados por saltos nos preços dos materiais, escolhas de projeto, condições de obra e mudanças no mercado de trabalho. Muitos modelos modernos de aprendizado de máquina conseguem capturar esses padrões complexos, mas frequentemente funcionam como caixas‑pretas e tipicamente produzem apenas um palpite único, sem indicar o quanto esse palpite pode estar errado.

Um novo modelo híbrido para previsões mais inteligentes

Os autores propõem um sistema de aprendizado híbrido chamado NGBoost‑ETR que tenta enfrentar três problemas ao mesmo tempo: precisão, incerteza e transparência. No núcleo está uma tecnologia conhecida como Natural Gradient Boosting (NGBoost), projetada para produzir não apenas uma estimativa de custo, mas uma curva de probabilidade completa ao redor dessa estimativa. Em vez de dizer “a laje custará 17 dólares por pé quadrado”, o modelo diz efetivamente: “17 é o valor mais provável, mas veja quanto ele pode realisticamente ser maior ou menor.” Para tornar o NGBoost mais potente em dados de construção, os autores substituem suas árvores simples habituais por um aprendiz baseado em árvores mais forte chamado Extra Trees Regression, especialmente capaz de capturar relações não lineares entre entradas como tipo de laje, área do pavimento, cargas e preços unitários dos materiais.

Como o modelo foi testado no mundo real

Para verificar se a abordagem funciona na prática, os pesquisadores treinaram e testaram o modelo em 4.477 registros reais do RSMeans, uma base de dados de custos dos EUA amplamente usada para componentes de edifícios. Cada registro descreve um conjunto estrutural de pavimento — como lajes unidirecionais, lajes planas ou lajes waffle — juntamente com sua área, cargas esperadas e custo unitário do concreto e das fôrmas. O desempenho do modelo foi comparado com 10 métodos populares de aprendizado de máquina e 9 outros híbridos NGBoost. Medidas padrão de precisão mostraram que o NGBoost‑ETR produziu algumas das melhores previsões pontuais, com erros médios muito pequenos em dados não vistos. Igualmente importante, a equipe avaliou quão bem as faixas previstas de incerteza correspondiam à realidade, usando um conjunto de seis métricas de incerteza que julgam tanto com que frequência o custo real cai dentro da faixa prevista quanto quão estreita essa faixa é.

Figure 2
Figure 2.

Ver quais fatores impulsionam o custo

Como os tomadores de decisão relutam em confiar em uma caixa‑preta, os autores incorporam explicabilidade ao desenho usando SHAP, uma técnica moderna que atribui a cada entrada um escore de contribuição para cada previsão. Isso permite aos usuários ver, por exemplo, quanto preços elevados de fôrmas, um tipo específico de laje ou uma grande área tributária elevaram ou reduziram uma previsão para um projeto individual. No conjunto de dados, o custo das fôrmas surge como o fator mais influente do custo total, seguido pelo tipo de laje e pela área. Ao vincular essas explicações diretamente à estimativa central de custo do modelo, os profissionais podem examinar se as previsões estão alinhadas com seu conhecimento da área e ajustar projetos ou negociações conforme necessário.

O que isso significa para projetos futuros

No geral, o arcabouço NGBoost‑ETR fornece previsões de custo altamente precisas, intervalos de incerteza relativamente estreitos e bem comportados, e uma visão clara de quais variáveis importam mais. Alguns modelos concorrentes ofereceram cobertura ligeiramente maior dos custos reais, mas apenas prevendo faixas irrealisticamente amplas, de pouca utilidade prática. O novo modelo, em vez disso, busca um equilíbrio: pode falhar em acertar o custo exato um pouco mais frequentemente do que um método extremamente conservador, mas quando fornece uma faixa, essa faixa é compacta o suficiente para orientar orçamentos, propostas e planejamento de riscos no mundo real. Para leitores leigos, a principal conclusão é que esta pesquisa move a previsão de custos de construção do palpite fundamentado para uma espécie de “previsão do tempo” dos orçamentos — uma que diz não só o que é provável que aconteça, mas quão confiáveis são essas previsões.

Citação: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8

Palavras-chave: previsão de custos de construção, aprendizado de máquina probabilístico, gestão de risco de projetos, IA explicável, planejamento de infraestrutura