Clear Sky Science · zh
基于清洁生产原则的露天矿设计中减少废石的 Q 学习方法
为何更智能的矿山至关重要
现代社会依赖金属,从手机里的铜到电网的接线。然而获取这些金属通常意味着在地表开挖巨大的露天矿并搬运惊人的岩石量。大部分岩石是废石,必须运输、堆放并长期监测数十年。本研究探讨了一种新的露天矿设计方法,利用人工智能,特别是一种称为 Q 学习的方法,在保持矿山盈利的同时减少废石及其环境损害。
搬山的隐性成本
在典型的露天铜矿中,工程师首先划定最终采坑界限——在矿山寿命期内值得开采的外壳。在该外壳内的是含有有价金属的矿石;在外面的是开采成本过高的岩体。传统设计方法几乎完全关注金属销售带来的收益减去钻孔、爆破、运输和加工等直接成本,基本忽略了处置废石的长期环境账单,如土地退化、污染以及酸性矿山排水的风险。因此,一口矿在纸面上可能看起来有利可图,却在悄然间为未来的清理和水处理锁定巨额负担。
教会数字代理去挖掘
研究人员将采坑设计重新构想为一个学习问题,而不是一次性计算。他们把矿体划分为数千个三维方块,每个方块都有自己的收益、开采成本、加工成本以及按吨估算的环境成本。计算机“代理”在模拟矿山环境中一步步练习开采这些方块。当它选择那些在遵守安全边坡角的前提下能提升总体价值的方块时,会获得正奖励;当它违规坡角规则或追逐在计入环境影响后变得不再盈利的方块时,会受到惩罚。经过多轮训练,代理通过 Q 学习发现了一种采矿模式——即策略,能够在盈利与减废、降低环境负担之间取得平衡。

从玩具模型到大型铜矿
为了验证该想法,团队首先将 Q 学习框架应用于小型二维和三维测试矿床。在这些实验中,数字代理逐步改进其策略:早期的采坑形状参差不齐且效率低下,但经过数千次学习步骤后,采坑变得平滑、逼真且经济合理。关键改变是将环境成本纳入每个方块的价值之后,许多曾经看起来有吸引力的边际方块变为净亏损,代理因此学会让它们留在地里。重要的是,最终设计的采坑几乎开采了相同数量的矿石,但需要移除更少的废石。
现实矿业中的权衡
真正的证据来自于将该方法应用于伊朗的萨尔切什梅铜矿——该国最大的铜矿之一。研究团队将基于 Q 学习的新设计与行业标准的 Lerchs–Grossmann 算法进行了比较,后者仅优化财务回报。传统设计在纸面上产生了略高的利润,但这是以忽视环境成本为代价。相反,Q 学习设计将废石减少了数百万吨,同时几乎回收了相同数量的矿石。在同一台计算机上,其运算速度也更快,将优化时间缩短了约 20%。最终的结果是一个较小且更紧凑的采坑,会扰动更少的土地并暴露更少可能产生酸性径流的物质,同时不会牺牲显著的收入。

重新思考“利润”的真正含义
对非专业读者而言,主要信息是:我们如何设计矿山可以显著改变其长期足迹,即使短期利润看起来相近。通过教算法从设计的第一步就把环境破坏视为真实成本,研究表明可以在几乎相同产量的前提下搬动更少的岩石、留下更小的创伤,并且以后可能需要支付更少的清理费用。换言之,最聪明的矿山不是今天榨取每一美元的那个,而是认识到自然的账单终将到期并据此进行规划的那个。
引用: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w
关键词: 露天采矿, 废石, 强化学习, 可持续采矿, 矿山设计