Clear Sky Science · zh
通过贝叶斯空间模型与基于分形的背景分离相结合的随机森林,推进被审查的地球化学金(Au)预测
为什么极微量的金很重要
当地质学家寻找新的金矿时,经常处理的土壤样本中金含量只有每十亿分之几。那些超低值接近实验室仪器的检出限,许多测量结果仅以“低于检出限”报告。如果对这些近乎不可见的痕量处理不当,潜在的富矿区可能会被遗漏或绘制不准确。本研究提出了一种更智能的方法,从这些被删失的数值中恢复信息,帮助勘探者从有限且噪声较大的数据中更清晰地识别地下模式。
有缺陷测量中的隐含信号
土壤和岩石化学是矿产勘查的重要工具,因为微小的化学变化可能表明埋藏的矿体。但仪器无法测量无限小的量。在本研究中,对于金,任何低于几每十亿分之一的样本都被视为删失:实验室只能说明真实值位于该限值以下。常见的简便处理往往将所有此类结果替换为一个常数,例如检出限的一半。虽然便捷,但这种做法会抹平自然变异,模糊微妙异常,并扭曲金与铜等其他元素之间的关系。作者主张,为了真正解读地球的化学指纹,我们必须保留这些低值的不确定性,而不是将其覆盖掉。
从地质图到更干净的背景
研究聚焦于伊朗中部北达利附近的一个铜—金矿化前景区,在已知的斑岩系统上以紧密网格采集了165个土壤样本。对金及另外29种元素进行了测定,其中14个样本低于假定的5每十亿分之一的检出限。研究组没有将所有数据直接输入模型,而是先使用一种“分形”浓度—数目方法将背景值与较强异常分离。通过在对数—对数图上分析随金浓度增加样本数量的变化,他们识别出划分背景、弱异常和强异常的阈值。仅使用包括删失值在内的背景群体来构建预测模型,降低了少数高品位样本主导学习的风险。

由铜引导的概率图
为了估计删失样本的真实金含量,作者随后应用了贝叶斯高斯随机场模型,这是一种概率性的空间方法。该模型将金浓度视为在地图上平滑变化的场,既受空间位置影响,也受铜含量影响——在该斑岩背景下铜与金密切相关。模型不是为每个删失点猜测一个单一数值,而是生成完整的概率分布,遵循真实值必须低于检出限这一事实。结果是对14个删失样本给出与邻近测量和岩石中观察到的金—铜配对一致的最佳估计和不确定性范围。
在关键处调优的机器学习
这些概率估计随后作为输入进入随机森林模型,一种将多棵决策树集成的机器学习方法。模型使用来自背景群体的金、铜、铁、镍、钛和硼来学习模式,并通过严格的交叉验证确保每个样本仅在未见过其数据的模型上进行测试。初步预测在接近检出限处仍倾向于偏高,这是当极低值样本较少时的常见问题。为纠正这一点,作者进行了针对性校准,专注于5–8每十亿分之一的范围,然后应用简单的缩放步骤以保证调整后的预测保持在物理上有意义的界限内。这个三步链——分形分离、贝叶斯空间估计和校准的随机森林——生成的预测比标准方法更准确地匹配实际的低金值。
优于传统捷径
研究将新框架与基本随机森林以及两种用固定检出限分数替换删失结果的经典替代规则进行了比较。在多个误差度量上,经校准和缩放的混合模型既最准确又偏差最小,尤其是在检出限附近样本——微小误差最重要的区域。它还保留了现实的变异性并维持了金与铜之间的合理关系,而将所有删失值替换为单一常数会破坏这种结构。在某些靠近高端的删失样本中,新方法的相对误差比传统替代方法小数百倍。

为勘查带来更清晰的化学图像
对非专业人士而言,结论是我们如何处理地球化学数据中的“低于检出限”数值,可能决定寻找新矿床的成败。与其用粗糙的替代法抹去不确定性,本研究表明将概率性空间建模、机器学习和简单校准相结合,可以从低水平测量中恢复大量隐含信息。其结果是更清晰的微弱金分布图、更可靠的异常识别,最终能以更少的钻孔和更诚实的数据提高发现矿体的机会。
引用: Mahdiyanfar, H. Advancing censored geochemical Au prediction through Bayesian spatial models and Random Forest with fractal-based background separation. Sci Rep 16, 4763 (2026). https://doi.org/10.1038/s41598-026-34999-4
关键词: 地球化学勘查, 删失数据, 金异常, 贝叶斯空间建模, 地质学中的机器学习