Clear Sky Science · es

Un enfoque de Q-learning para la reducción de material estéril en el diseño de minas a cielo abierto basado en principios de producción más limpia

· Volver al índice

Por qué importan las minas más inteligentes

La sociedad moderna funciona gracias a los metales, desde el cobre de nuestros teléfonos hasta el cableado de las redes eléctricas. Obtener esos metales, sin embargo, a menudo implica excavar enormes canteras a cielo abierto y mover cantidades colosales de roca. La mayor parte de esa roca es material estéril que debe transportarse, depositarse y vigilarse durante décadas. Este estudio explora una nueva forma de diseñar minas a cielo abierto que utiliza inteligencia artificial, concretamente un método llamado Q-learning, para reducir el material estéril y su impacto ambiental sin dejar de mantener la rentabilidad de las minas.

El coste oculto de mover montañas

En una típica mina de cobre a cielo abierto, los ingenieros primero definen el límite final de la excavación —la carcasa exterior de roca que merece extraerse a lo largo de la vida de la mina. Dentro de esa carcasa se encuentra el mineral que contiene metal valioso; fuera de ella está la roca cuya extracción resulta demasiado cara. Los métodos de diseño tradicionales se centran casi exclusivamente en el dinero obtenido por la venta del metal menos los costes directos de perforación, voladura, acarreo y procesamiento. Ignoran en gran medida las facturas ambientales a largo plazo por el manejo del material estéril, como la degradación del suelo, la contaminación y el riesgo de drenaje ácido de minas. Como resultado, un tajo puede parecer atractivo sobre el papel mientras encierra en silencio enormes responsabilidades futuras de limpieza y tratamiento de agua.

Enseñando a un agente digital a excavar

Los investigadores replantearon el diseño del tajo como un problema de aprendizaje en lugar de un cálculo puntual. Dividieron el yacimiento en miles de bloques tridimensionales, cada uno con su propio ingreso, coste de extracción, coste de procesamiento y un coste ambiental por tonelada de mineral y estéril cuidadosamente estimado. Un «agente» informático practica entonces la extracción de esos bloques paso a paso dentro de una mina simulada. Cuando elige bloques que aumentan el valor global respetando los ángulos seguros de las paredes, recibe una recompensa positiva; cuando viola las normas de talud o persigue bloques que resultan no rentables una vez contabilizados los impactos ambientales, es penalizado. Tras muchos ciclos de entrenamiento, el agente utiliza Q-learning para descubrir un patrón de extracción —una política— que equilibra la rentabilidad con menos material estéril y menores cargas ambientales.

Figure 1
Figura 1.

De modelos toy a un gigantesco tajo de cobre

Para probar la idea, el equipo aplicó primero el marco de Q-learning a pequeños yacimientos de prueba en dos y tres dimensiones. En estos experimentos, el agente digital mejoró gradualmente su estrategia: los primeros diseños de tajo eran dentados e ineficientes, pero después de miles de pasos de aprendizaje los tajos se volvieron suaves, realistas y económicamente sólidos. El cambio clave fue que, una vez que los costes ambientales se incorporaron al valor de cada bloque, muchos bloques marginales que antes parecían atractivos se convirtieron en pérdidas netas, por lo que el agente aprendió a dejarlos en el suelo. De forma importante, los tajos resultantes extraían casi la misma cantidad de mineral pero requerían menos retirada de material estéril.

Minería real, compensaciones reales

La prueba real vino al aplicar el método a la mina de cobre Sarcheshmeh en Irán, una de las mayores explotaciones del país. El nuevo diseño basado en Q-learning se comparó con el algoritmo estándar de la industria de Lerchs–Grossmann, que optimiza puramente el rendimiento financiero. El diseño tradicional produjo un beneficio ligeramente mayor en el papel, pero lo hizo pasando por alto los costes ambientales. El diseño con Q-learning, en cambio, redujo el material estéril en millones de toneladas mientras recuperaba casi exactamente la misma cantidad de mineral. Además, se ejecutó más rápido en el mismo ordenador, reduciendo el tiempo de optimización en aproximadamente un 20 por ciento. El resultado final fue un tajo algo más pequeño y compacto que alteraría menos terreno y expondría menos material capaz de generar escorrentía ácida, sin sacrificar ingresos significativos.

Figure 2
Figura 2.

Repensar lo que «beneficio» realmente significa

Para quienes no son especialistas, el mensaje principal es que la forma en que diseñamos las minas puede cambiar drásticamente su huella a largo plazo, incluso si los beneficios a corto plazo parecen similares. Al enseñar a un algoritmo a tratar el daño ambiental como un coste real desde el primer paso del diseño, el estudio muestra que es posible extraer casi tanto metal mientras se mueve menos roca, dejando una cicatriz menor y probablemente pagando menos por la limpieza más adelante. En otras palabras, la mina más inteligente no es la que exprime cada último dólar hoy, sino la que reconoce que la factura de la naturaleza acabará llegando —y planifica en consecuencia.

Cita: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w

Palabras clave: minería a cielo abierto, material estéril, aprendizaje por refuerzo, minería sostenible, diseño de minas