Clear Sky Science · es
Predicción de costes de construcción con conciencia de incertidumbre y explicabilidad mediante un modelo de aprendizaje probabilístico híbrido
Por qué importa el precio de un edificio antes de construirse
Antes de que la pala toque la tierra, propietarios y constructores deben estimar cuánto costará realmente un proyecto. Si esa estimación falla, los presupuestos se desbordan, los plazos se retrasan y la confianza entre las partes se erosiona. Este artículo presenta una nueva forma de prever los costes de construcción que no solo busca ser precisa, sino que también indica cuánta confianza hay en la predicción y por qué el modelo considera que un proyecto será caro o barato. Esa combinación de precisión, honestidad sobre la incertidumbre y explicaciones claras es lo que hace que este trabajo sea relevante para cualquiera interesado en cómo los datos y la inteligencia artificial pueden reducir el riesgo en proyectos de gran envergadura.

El problema de las estimaciones tradicionales de costes
Durante décadas, los costes de construcción se han estimado mediante el juicio de expertos y estadísticas sencillas. Estos métodos se basan mucho en proyectos pasados y en la experiencia humana. Son fáciles de comprender, pero tienen dificultades cuando los proyectos se vuelven más complejos, cuando los mercados son volátiles o cuando muchos factores interactúan de forma enmarañada. Las herramientas estadísticas clásicas asumen relaciones lineales entre las entradas y los costes, aun cuando los proyectos reales se ven afectados por saltos en los precios de los materiales, decisiones de diseño, condiciones del emplazamiento y cambios en el mercado laboral. Muchos modelos modernos de aprendizaje automático pueden captar estos patrones complejos, pero a menudo actúan como cajas negras y suelen ofrecer una única predicción puntual, sin indicar cuánto podría fallar esa predicción.
Un nuevo modelo híbrido para previsiones más inteligentes
Los autores proponen un sistema de aprendizaje híbrido llamado NGBoost‑ETR que intenta abordar tres problemas a la vez: precisión, incertidumbre y transparencia. En su núcleo está una técnica conocida como Natural Gradient Boosting (NGBoost), diseñada para entregar no solo una estimación de coste, sino toda una curva de probabilidad alrededor de esa estimación. En lugar de afirmar “la losa costará 17 dólares por pie cuadrado”, el modelo dice efectivamente: “17 es el valor más probable, pero esto es cuánto podría ser razonablemente más alto o más bajo”. Para hacer NGBoost más potente con datos de construcción, los autores sustituyen sus árboles simples habituales por un aprendiz arbóreo más robusto llamado Extra Trees Regression, especialmente apto para captar relaciones no lineales entre entradas como tipo de losa, área del piso, cargas y precios unitarios de material.
Cómo se probó el modelo en el mundo real
Para comprobar si el enfoque funciona en la práctica, los investigadores entrenaron y evaluaron su modelo con 4.477 entradas reales de RSMeans, una base de datos estadounidense de costes de componentes de edificación muy utilizada. Cada registro describe un ensamble estructural de piso —como losas unidireccionales, losas planas o losas reticulares— junto con su área, cargas esperadas y el coste unitario del hormigón y del encofrado. El rendimiento del modelo se comparó con 10 métodos populares de aprendizaje automático y con 9 otros híbridos de NGBoost. Las medidas estándar de precisión mostraron que NGBoost‑ETR produjo algunas de las mejores predicciones puntuales, con errores medios muy pequeños en datos no vistos. Igualmente importante, el equipo evaluó qué tan bien las bandas previstas por el modelo coincidían con la realidad, usando un conjunto de seis métricas de incertidumbre que valoran tanto la frecuencia con la que el coste real cae dentro de la banda prevista como lo estrecha que es esa banda.

Ver qué factores impulsan el coste
Como los responsables de la toma de decisiones son reacios a confiar en una caja negra, los autores incorporan explicabilidad en su diseño usando SHAP, una técnica moderna que asigna a cada entrada una puntuación de contribución para cada predicción. Esto permite a los usuarios ver, por ejemplo, cuánto empujaron hacia arriba o hacia abajo una predicción los altos precios del encofrado, un tipo concreto de losa o una gran área tributaria en un proyecto individual. En todo el conjunto de datos, el coste del encofrado surge como el factor más influyente del coste total, seguido por el tipo de losa y el área. Al vincular estas explicaciones directamente con la estimación central del modelo, los profesionales pueden examinar si las predicciones se alinean con su conocimiento del dominio y ajustar diseños o negociaciones en consecuencia.
Qué significa esto para proyectos futuros
En conjunto, el marco NGBoost‑ETR ofrece previsiones de coste muy precisas, rangos de incertidumbre relativamente ajustados pero bien comportados y una visión clara de qué variables importan más. Algunos modelos competidores ofrecieron una cobertura ligeramente mayor de los costes reales, pero solo prediciendo bandas irrealísticamente amplias que tienen poco uso práctico. El nuevo modelo, en cambio, consigue un equilibrio: puede fallar la cifra exacta con algo más de frecuencia que un método extremadamente conservador, pero cuando proporciona un rango, ese rango es lo bastante compacto como para informar presupuestos, licitaciones y planificación de riesgos en el mundo real. Para el lector general, la conclusión clave es que esta investigación desplaza la predicción de costes de construcción de conjeturas fundamentadas hacia un “pronóstico” más honesto y basado en datos para los presupuestos de proyecto —uno que diga no solo qué es probable que ocurra, sino cuánta seguridad tenemos en ello.
Cita: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8
Palabras clave: predicción de costes de construcción, aprendizaje automático probabilístico, gestión de riesgos de proyectos, IA explicable, planificación de infraestructuras