Clear Sky Science · ru

Прогнозирование стоимости строительства с учётом неопределённости и объяснимостью с помощью гибридной вероятностной модели обучения

· Назад к списку

Почему цена здания важна ещё до его возведения

Ещё до того, как лопата коснётся земли, владельцам и застройщикам необходимо оценить, во сколько на самом деле обойдётся проект. Если эта оценка ошибочна, бюджеты превышаются, сроки сдвигаются, а доверие между партнёрами разрушается. В этой статье предложен новый способ прогнозирования затрат на строительство, который не только стремится к высокой точности, но и сообщает, насколько уверенным является прогноз, а также объясняет, почему модель считает проект дорогим или дешёвым. Именно сочетание точности, честности в отношении неопределённости и ясных объяснений делает эту работу значимой для всех, кто интересуется тем, как данные и искусственный интеллект могут снизить риски крупных проектов.

Figure 1
Figure 1.

Проблемы традиционных методов оценки стоимости

Десятилетиями затраты на строительство оценивали с опорой на экспертные суждения и простую статистику. Эти подходы опираются на прошлые проекты и человеческий опыт. Их легко понять, но они плохо справляются, когда проекты усложняются, рынки нестабильны или множество факторов взаимодействуют запутанным образом. Классические статистические инструменты предполагают линейные зависимости между входными данными и затратами, хотя в реальности на проекты влияют резкие скачки цен на материалы, дизайнерские решения, условия строительной площадки и изменения на рынке труда. Многие современные модели машинного обучения умеют улавливать такие сложные закономерности, но зачастую ведут себя как чёрные ящики и обычно выдают единственную наилучшую оценку, не показывая, насколько она может быть ошибочной.

Новая гибридная модель для более разумных прогнозов

Авторы предлагают гибридную систему обучения под названием NGBoost‑ETR, направленную на решение трёх задач одновременно: точности, учёта неопределённости и прозрачности. В её основе лежит технология Natural Gradient Boosting (NGBoost), предназначенная не просто выдавать оценку стоимости, а формировать полное вероятностное распределение вокруг этой оценки. Вместо того чтобы сказать «плита будет стоить 17 долларов за квадратный фут», модель фактически сообщает: «17 — наиболее вероятное значение, но вот насколько больше или меньше оно может оказаться на практике». Для повышения эффективности NGBoost на данных строительства авторы заменяют стандартные простые деревья более мощным древовидным алгоритмом Extra Trees Regression, который особенно хорошо улавливает нелинейные связи между входными параметрами, такими как тип плиты, площадь, нагрузки и единичные цены материалов.

Как модель проверяли на практике

Чтобы проверить работоспособность подхода, исследователи обучили и протестировали модель на 4 477 реальных записях из RSMeans — широко используемой американской базы данных стоимости компонентов зданий. Каждая запись описывает конструктивную сборку пола — например, односторонние плиты, плоские плиты или вафельные плиты — вместе с её площадью, ожидаемыми нагрузками и единичной стоимостью бетона и опалубки. Работоспособность модели сравнивали с 10 популярными методами машинного обучения и 9 другими гибридами NGBoost. Стандартные метрики точности показали, что NGBoost‑ETR даёт одни из лучших точечных прогнозов с очень малыми средними ошибками на невидимых данных. Не менее важно, что команда оценивала, насколько предсказанные моделью интервалы соответствуют реальности, используя набор из шести метрик неопределённости, которые оценивают и то, как часто реальная стоимость попадает в предсказанный интервал, и насколько этот интервал узок.

Figure 2
Figure 2.

Какие факторы определяют стоимость

Поскольку руководители проектов неохотно доверяют чёрным ящикам, авторы встроили объяснимость в конструкцию, используя SHAP — современную технику, присваивающую каждому входному параметру вклад в каждом прогнозе. Это позволяет пользователям увидеть, например, насколько высокие цены на опалубку, конкретный тип плиты или большая прилегающая площадь подняли или опустили прогноз для отдельного проекта. По всему набору данных оплата опалубки выявляется как самый влиятельный фактор общей стоимости, за ним следуют тип плиты и площадь. Привязав эти объяснения непосредственно к центральной оценке стоимости модели, практики могут проверить, совпадают ли предсказания с их экспертными представлениями, и при необходимости скорректировать проектные решения или условия переговоров.

Что это значит для будущих проектов

В целом, фреймворк NGBoost‑ETR даёт высокоточные прогнозы стоимости, относительно узкие и корректно ведущие себя интервалы неопределённости, а также ясные представления о том, какие переменные имеют наибольшее значение. Некоторые конкурирующие модели обеспечивали немного более высокое покрытие истинных затрат, но лишь за счёт предсказания нереалистично широких интервалов, мало пригодных для практического использования. Новая модель находит баланс: она может чуть чаще промахиваться мимо точной стоимости по сравнению с крайне консервативным методом, но когда предоставляет интервал — этот интервал достаточно компактен, чтобы информировать реальное бюджетирование, тендеры и планирование рисков. Для неспециалистов главный вывод заключается в том, что это исследование переводит прогнозирование стоимости строительства из разряда обоснованных предположений в более честный, основанный на данных «прогноз погоды» для проектных бюджетов — который говорит не только о том, что вероятно произойдёт, но и насколько мы в этом уверены.

Цитирование: Chen, L., Khalid, O.W., Tiang, JJ. et al. Uncertainty aware and explainable construction cost prediction using a hybrid probabilistic learning model. Sci Rep 16, 10973 (2026). https://doi.org/10.1038/s41598-026-44904-8

Ключевые слова: прогнозирование стоимости строительства, вероятностное машинное обучение, управление рисками проектов, объяснимая ИИ, планирование инфраструктуры