Clear Sky Science · zh

用于铝合金定量LIBS分析的机器学习:随机森林、梯度提升与极端随机树的比较

· 返回目录

这对日常金属使用为何重要

从飞机和汽车到饮料罐与手机外壳,铝合金无处不在。它们的性能依赖于成分配比的精准控制,但要快速且准确地检测这种配比并不容易。本研究展示了将快速激光检测与现代机器学习结合,如何精确读出铝合金内部成分,这可能帮助工业提高回收效率、减少浪费并提升产品安全性。

Figure 1. 来自金属的激光光线馈入类似树状的模型,该模型为合金中每种元素输出彩色条形。
Figure 1. 来自金属的激光光线馈入类似树状的模型,该模型为合金中每种元素输出彩色条形。

一台能“读”出金属组成的激光仪

这项工作围绕一种叫激光诱导击穿光谱(LIBS)的技术展开。简单来说,一次短促且高强度的激光脉冲照射金属表面,会将微量材料炸成一个发光等离子体云。随着该云冷却,它会发出取决于存在元素的颜色光谱。通过光谱仪记录跨越多个波长的这种彩色指纹。LIBS 之所以有吸引力,是因为它速度快、几乎不需要样品制备,并且可现场使用。然而,将那些复杂的光模式转换为每种元素(如铜、锌或镁)的准确含量并不容易。自吸收、不同元素谱线重叠以及每次激发产生的等离子体差异等效应,都使颜色与成分之间的关系强烈非线性。

让算法从大量光谱中学习

为了解决这个问题,作者转向机器学习,让计算机从数据中学习模式而不是依赖固定公式。他们收集了500条来自经认证铝样品的LIBS光谱,包括商用纯铝和含有不同含量铜与锌的合金。每条光谱都经过了细致的平滑处理、在宽波段内的插值和归一化,以便整体光谱而不仅是少数峰值可以输入模型。与其手动挑选特征,研究者将大约六千个强度值/光谱直接交给模型,使其能发现隐藏在发光中的微量元素的细微信号。

三种基于树的方法一决高下

团队比较了三种相关的机器学习方法,它们都构建了大量决策树的集成:随机森林、梯度提升和极端随机树。这些方法通过反复分裂数据到不同分支,最终导出预测的成分。通过结合许多这样的树,它们可以处理复杂且带噪声的关系。研究者用大部分光谱来训练模型,并留出一些用于测试。随后他们检验每种方法预测铝、铜、锌、镁、铁和硅含量的能力。三种方法都达到了很高的准确度,平均误差远低于质量百分比的0.25%。其中,极端随机树模型总体表现最佳,给出最低的误差并与参考值具有最高的一致性,尤其是在二元和三元合金(多种元素相互作用)情形下。

Figure 2. 多层合金样本发出光谱进入三种树集成模型,最终汇聚为高度聚簇的成分条。
Figure 2. 多层合金样本发出光谱进入三种树集成模型,最终汇聚为高度聚簇的成分条。

对真实样品与局限性的测试

为检验模型是真正具有泛化能力而非记忆训练样本,作者在训练过程中未使用的独立样品上对模型进行测试。对这些新合金的预测仍然接近经认证的成分,证明模型能处理未见过的样本。极端随机树方法再次表现出最稳定的行为,而梯度提升产生的结果更为可变,有时看似在统计上可接受恰恰是因为其更大的波动。研究还发现一个重要的实际限制:当训练数据中某一合金系列只有一个样本时,预测变得不可靠。模型至少需要每个系列三个具有代表性的样本,才能学习到可能的成分范围。

用通俗的话说明这项研究的意义

归根结底,本文表明:一种基于快速激光的检测方法,配合恰当选择的机器学习工具,能够高精度地读出铝合金的“配方”。基于高度随机化树的最佳方法,即便在光谱含噪且化学成分复杂的情况下,也能保持较小的误差。工作同时强调,良好结果不仅依赖于聪明的算法,还依赖于多样化的训练集。随着更多已知样品库的建立,这种组合方法有望成为工厂与回收企业实时检测金属质量的实用、可扩展手段。

引用: Capella, A.G., López, M.M., de Damborenea González, J.J. et al. Machine learning for quantitative LIBS analysis of aluminum alloys: a comparison of random forest, gradient boosting, and extremely randomized trees. Sci Rep 16, 14758 (2026). https://doi.org/10.1038/s41598-026-46449-2

关键词: 激光诱导击穿光谱, 机器学习, 铝合金, 随机森林, 光谱分析