Clear Sky Science · zh
使用混合效应随机森林与蜜蜂群优化对高路堤安全系数的预测
为什么路堤的稳定性很重要
当你沿着建在高土墩上的公路行驶时,你是在信任这座人工堆起的土堤不会突然塌陷。这些高路堤的安全以一个称为“安全系数”的数值来评判,它将保持土体不滑动的抗力与促使其滑动的驱动力进行比较。传统上,工程师依赖人工计算或大型数值模拟来估算该系数。本研究展示了现代机器学习如何使这些预测更快且更可靠,从而有可能降低威胁人员、财产和交通网络的灾难性边坡失稳风险。
构建数千个虚拟路堤
为了训练和测试他们的模型,研究者首先使用先进的数值模拟生成了大规模且逼真的数据集,而不是仅依赖少数实地案例。他们模拟了高度在6至30米之间的路堤,采用多种坡面形状,包括利用水平台阶(称为里界或坝肩)以改善稳定性的阶梯式设计。研究中改变了关键土体参数——例如土体重度、水含量、刚度、抗滑强度和黏聚力——以及堤基下方基础土的强度。对每一种共1,176个情形,采用有限元程序计算了安全系数并搜索出最可能的滑动面,提供了可作为机器学习预测评估的可信“真实值”。

从经典模型到更智能的森林
研究团队随后比较了三类数据驱动模型。第一类是众所周知的随机森林方法,它通过组合大量决策树来给出稳健的预测。第二类称为混合效应随机森林(Mixed Effects Random Forest),该方法在此基础上扩展,通过显式考虑分组或“簇状”数据来建模——这正是岩土工程中常见的情形,例如一组测量可能来自同一场地、土层或施工阶段。最后,他们引入了一种新的混合方法:基于人工蜂群优化的混合效应随机森林(ABC‑MERF)。在这里,受蜜蜂觅食行为启发的群体优化算法会自动调整混合效应森林的众多超参数,从而在无需工程师反复试错的情况下提升性能。
清洗数据并验证预测
在训练模型之前,研究者对数据进行了细致的预处理。他们使用标准箱线图方法识别极端异常值,并将其限定在合理范围内,以免罕见的异常数值扭曲学习过程。所有输入随后被缩放到0到1之间,这既适合蜂群优化器的工作,也便于不同变量间的比较。数据被划分为训练集和测试集,并采用严格的评估协议,使用多种误差度量来衡量预测与模拟安全系数的吻合程度以及模型能解释数据变异的比例。额外检查,如残差图和统计检验,被用于确认模型并非只是记住训练数据,而是确实学习到了潜在规律。

模型在土体与边坡方面学到了什么
三种方法都表现出色,但ABC‑MERF模型名列前茅。它能解释超过99%的安全系数变异,且典型预测误差维持在安全系数范围的约2%左右。同样重要的是,模型的行为具有物理意义。特征重要性分析与响应曲线显示,堤体土的内摩擦角和堤高是最具影响力的因素,其次为坡度陡峭程度、黏聚力以及是否使用里界/平台。较高的摩擦角和更大的黏聚力提高了稳定性,而更高的堤高和更陡的坡度则降低了稳定性——这与基础的土力学预测完全一致。数据驱动结果与工程理论的一致性对于从业者信任机器学习工具在安全关键设计中的应用至关重要。
从研究工具到工程助手
研究结论认为,精心设计的混合效应随机森林与蜜蜂启发优化的混合体,能够提供高精度且具有物理意义的高路堤安全系数预测。对非专业读者而言,核心信息是工程师现在可以将详尽的虚拟测试与先进的机器学习相结合,迅速筛选大量设计方案并在建造前识别出高风险的配置。尽管此类模型不能替代专家判断或特定场地的勘查——尤其是在地震或强降雨等条件下——它们提供了一种强大的决策支持工具,有助于在道路长期服役期间保持路堤的稳定与安全。
引用: Boufarh, R., Boursas, F., Bakri, M. et al. Factor of safety prediction for high road embankments using mixed effects random forest and bee colony optimization. Sci Rep 16, 6003 (2026). https://doi.org/10.1038/s41598-026-35431-7
关键词: 边坡稳定性, 路堤, 安全系数, 机器学习, 岩土工程