Clear Sky Science · ru
Сравнительная оценка методов машинного обучения и глубокого обучения для прогнозирования прочности на сжатие геополимерного бетона
Новый подход к разработке более экологичного бетона
Бетон — основа современных городов, но производство обычного цемента выделяет большие объёмы углекислого газа. Геополимерный бетон предлагает более чистую альтернативу, однако инженерам по‑прежнему трудно предсказать, какой будет его прочность после затвердевания. В этом исследовании показано, как современные инструменты работы с данными, включая машинное и глубокое обучение, могут обучаться на сотнях прошлых экспериментов, чтобы прогнозировать прочность составов геополимерного бетона и помогать проектировать более экологичные решения с меньшим числом дорогостоящих пробных партий.
Почему создание более экологичного бетона сложно
Геополимерный бетон заменяет значительную часть обычного цемента промышленными побочными продуктами, такими как зола-уноса, шлак, метакаолин и кремнезёмный дым. Эти порошки реагируют с щелочными растворами, образуя твёрдый, камнеподобный материал, который может сопоставимо или лучше по прочности, чем стандартный бетон, при этом сокращая выбросы углерода примерно до 70 процентов. Но такая «экологичная» рецептура чувствительна: прочность зависит от множества взаимосвязанных факторов — типа и количества порошков, дозировки и концентрации щелочных растворов, объёма воды и добавок, зерен песка и щебня, добавленных волокон для повышения прочности на изгиб, а также времени и условий твердения. Поскольку все эти компоненты взаимодействуют сложными, нелинейными способами, простых уравнений недостаточно для точного прогнозирования прочности нового состава.

Формирование крупной обобщённой базы данных
Чтобы справиться с этой сложностью, авторы собрали большую унифицированную базу данных из 19 опубликованных исследований, охватывающую 594 различных состава геополимерного бетона. В каждой записи указаны ключевые ингредиенты: количества золы-уноса, шлака, метакаолина, кремнезёмного дыма, песка, щебня, воды, щелочных растворов и суперпластификатора, а также стальные и полипропиленовые волокна и возраст выдержки в днях. Команда тщательно очистила данные: удалили дубликаты, унифицировали единицы измерения и названия переменных и оставили только те составы, где была полная информация. В результате получился разнообразный, но согласованный набор, охватывающий широкий диапазон прочностей — от относительно слабых до высокопрочных бетонных составов, что отражает реальное распределение по результатам многих лабораторий.
Обучение моделей на прошлых составах
Имея эту базу данных, исследователи обучили ряд предиктивных моделей. С классической стороны использовались методы машинного обучения, включая деревья решений, случайные леса и продвинутые методы «усиления» (boosting), которые объединяют множество простых моделей в мощный предиктор. С точки зрения глубокого обучения тестировали две нейронные сети разной глубины и современную табличную модель TabNet, использующую механизм внимания для выделения наиболее информативных ингредиентов. Данные были разделены так, что 80 процентов составов шли на обучение моделей, а оставшиеся 20 процентов — на тест, чтобы оценить, насколько хорошо каждый метод предсказывает невидимые ранее результаты с помощью стандартных метрик ошибки и качества аппроксимации.
Какие модели сработали лучше и почему
Ясным лидером среди методов машинного обучения стал алгоритм усиления CatBoost, обеспечивший очень точные прогнозы прочности и хорошо согласующийся с тестовыми данными по всему диапазону значений. Второе место занял другой бустинговый метод, XGBoost. Среди инструментов глубокого обучения лучше всех показал себя TabNet и фактически соперничал с лучшей моделью машинного обучения, тогда как более глубокая нейронная сеть с большим числом слоёв выступила хуже — вероятно, из‑за того, что объём набора данных слишком мал для столь сложной архитектуры. Чтобы сделать эти «чёрные ящики» более прозрачными, авторы использовали инструмент объяснения SHAP, который присваивает оценку важности каждому входному параметру. Анализы показали, что содержание шлака и возраст выдержки стабильно доминируют при прогнозировании прочности, за ними следуют другие вяжущие компоненты, дозировка активатора и количество заполнителей, тогда как стальные и пластиковые волокна играют лишь второстепенную роль для прочности на сжатие, хотя они могут существенно влиять на трещинообразование и пластичность.

Что это значит для будущего строительства
Проще говоря, работа демонстрирует, что компьютеры могут обучаться на сотнях прошлых рецептур геополимерного бетона, чтобы быстро и надёжно оценивать прочность нового, экологичного состава. Вместо изготовления и разрушения большого числа контрольных цилиндров инженеры могут использовать эти модели, чтобы сузить круг многообещающих сочетаний порошков вяжущих, активирующих растворов и условий твердения до лабораторных испытаний. Исследование также указывает, какие ингредиенты наиболее важны и даёт практические рекомендации: правильный подбор содержания шлака, уровней активатора и условий твердения гораздо важнее для прочности на сжатие, чем тонкая настройка количества волокон. Хотя модели всё ещё требуют валидации на более крупных и стандартизованных наборах данных, эта методология является существенным шагом к проектированию бетона с меньшим углеродным следом на основе данных.
Цитирование: Ezz, H., Bakr, S.M. Comparative evaluation of machine learning and deep learning approaches for compressive strength prediction of geopolymer concrete. Sci Rep 16, 14652 (2026). https://doi.org/10.1038/s41598-026-50705-w
Ключевые слова: геополимерный бетон, машинное обучение, глубокое обучение, прогнозирование прочности на сжатие, устойчивое строительство