Clear Sky Science · es

Aprendizaje automático para el análisis cuantitativo LIBS de aleaciones de aluminio: comparación entre random forest, gradient boosting y extremely randomized trees

2026-05-12 · Volver al índice

Por qué importa para el uso cotidiano del metal

Desde aviones y coches hasta latas de bebidas y carcazas de teléfonos, las aleaciones de aluminio están por todas partes. Su rendimiento depende de obtener la mezcla de ingredientes con precisión, pero verificar esa mezcla de forma rápida y exacta no es sencillo. Este estudio muestra cómo combinar una prueba láser rápida con aprendizaje automático moderno puede proporcionar lecturas precisas de lo que hay dentro de las aleaciones de aluminio, lo que podría ayudar a la industria a reciclar mejor, reducir residuos y mejorar la seguridad del producto.

Figure 1. Luz láser sobre metal alimentando un modelo tipo árbol que genera barras coloreadas para cada elemento de la aleación.

Un láser que lee de qué está hecho el metal

El trabajo se centra en una técnica llamada espectroscopía de plasma inducido por láser, o LIBS. En términos sencillos, un pulso láser corto e intenso impacta la superficie del metal y vaporiza una pequeña cantidad de material en una nube incandescente. Al enfriarse esa nube, emite colores que dependen de los elementos presentes. Un espectrómetro registra esta huella colorida a través de muchas longitudes de onda. LIBS resulta atractivo porque actúa rápido, requiere casi ninguna preparación de muestra y puede emplearse in situ. Sin embargo, convertir esos patrones de luz complejos en cifras precisas para cada elemento, como cobre, zinc o magnesio, es difícil. Efectos como la autoabsorción, el solapamiento de líneas de distintos elementos y cambios en la nube caliente de disparo a disparo hacen que la relación entre color y composición sea fuertemente no lineal.

Dejar que los algoritmos aprendan de muchos espectros

Para abordar este problema, los autores recurrieron al aprendizaje automático, donde los ordenadores aprenden patrones a partir de datos en vez de seguir fórmulas fijas. Recolectaron 500 espectros LIBS de muestras de aluminio certificadas, incluyendo aluminio prácticamente puro y aleaciones con cobre y zinc en cantidades diversas. Cada espectro se suavizó cuidadosamente, se interpoló sobre un amplio rango de colores y se normalizó para que el patrón completo, no solo unos pocos picos, pudiera introducirse en los algoritmos. En lugar de seleccionar manualmente características, los modelos recibieron alrededor de seis mil valores de intensidad por espectro, lo que les permitió descubrir indicios sutiles de elementos minoritarios ocultos en el resplandor.

Tres modelos basados en árboles se enfrentan

El equipo comparó tres métodos de aprendizaje automático relacionados que construyen grandes conjuntos de árboles de decisión: Random Forest, Gradient Boosting y Extremely Randomized Trees. Estos métodos dividen los datos una y otra vez en ramas que finalmente conducen a una composición predicha. Al combinar muchos árboles, pueden gestionar relaciones complejas y ruidosas. Los investigadores entrenaron los modelos con la mayor parte de los espectros y reservaron algunos para pruebas. Luego comprobaron qué tan bien podía cada método predecir las cantidades conocidas de aluminio, cobre, zinc, magnesio, hierro y silicio. Los tres alcanzaron alta precisión, con errores medios muy por debajo de un cuarto de porcentaje en peso. Entre ellos, el modelo Extremely Randomized Trees rindió mejor en general, ofreciendo los errores más bajos y la mayor concordancia con los valores de referencia, especialmente para aleaciones binarias y ternarias donde interactúan varios elementos.

Figure 2. Capas de muestras de aleación enviando espectros a tres ensamblajes de árboles que convergen en barras de composición estrechamente agrupadas.

Pruebas con muestras reales y límites

Para comprobar si los modelos realmente generalizaban en lugar de memorizar, los autores los probaron con muestras independientes que no se usaron en el entrenamiento. Las predicciones para estas nuevas aleaciones se mantuvieron cercanas a las composiciones certificadas, lo que confirma que los modelos podían manejar casos no vistos. El enfoque de Extremely Randomized Trees volvió a mostrar el comportamiento más estable, mientras que Gradient Boosting produjo resultados más variables, que a veces parecían aceptables estadísticamente solo por esa mayor dispersión. El estudio también halló un límite práctico importante: cuando los datos de entrenamiento contenían solo una muestra de una familia de aleaciones, las predicciones se volvían poco fiables. Se necesitaban al menos tres muestras representativas por familia para que los modelos aprendieran el rango de composiciones posibles.

Qué significa el estudio en términos simples

En esencia, este artículo muestra que una prueba láser rápida, cuando se combina con herramientas de aprendizaje automático bien escogidas, puede leer la “receta” de las aleaciones de aluminio con alta precisión. El mejor método, basado en árboles altamente aleatorizados, mantiene los errores bajos incluso cuando los espectros son ruidosos y la química es compleja. El trabajo también enfatiza que obtener buenos resultados depende no solo de algoritmos inteligentes, sino también de contar con un conjunto de entrenamiento variado. Con bibliotecas más ricas de muestras conocidas, este enfoque combinado podría convertirse en una forma práctica y escalable para que fábricas y recicladores verifiquen la calidad del metal en tiempo real.

Cita: Capella, A.G., López, M.M., de Damborenea González, J.J. et al. Machine learning for quantitative LIBS analysis of aluminum alloys: a comparison of random forest, gradient boosting, and extremely randomized trees. Sci Rep 16, 14758 (2026). https://doi.org/10.1038/s41598-026-46449-2

Palabras clave: espectroscopía de plasma inducido por láser, aprendizaje automático, aleaciones de aluminio, random forest, análisis espectral