Clear Sky Science · pt

Uma abordagem de Q-learning para reduzir rocha estéril no projeto de minas a céu aberto baseada em princípios de produção mais limpa

· Voltar ao índice

Por que minas mais inteligentes importam

A sociedade moderna funciona graças aos metais, do cobre em nossos telefones às fiações nas redes elétricas. Obter esses metais, porém, frequentemente significa escavar enormes crateras a céu aberto e movimentar quantidades impressionantes de rocha. A maior parte dessa rocha é resíduo que precisa ser transportado, descartado e monitorado por décadas. Este estudo explora uma nova forma de projetar minas a céu aberto que usa inteligência artificial, especificamente um método chamado Q-learning, para reduzir a rocha estéril e seus danos ambientais, mantendo ao mesmo tempo a lucratividade das minas.

O custo oculto de mover montanhas

Em uma típica mina de cobre a céu aberto, os engenheiros primeiro definem o limite final da cava — a concha externa de rocha que vale a pena remover ao longo da vida útil da mina. Dentro dessa concha está o minério com metal valioso; fora dela está a rocha que é caro demais para minerar. Métodos tradicionais de projeto concentram-se quase inteiramente no dinheiro gerado pela venda do metal menos os custos diretos de perfuração, detonação, transporte e processamento. Eles em grande parte ignoram as contas ambientais de longo prazo para lidar com a rocha estéril, como degradação do solo, poluição e o risco de drenagem ácida de minas. Como resultado, uma cava pode parecer atraente no papel enquanto, silenciosamente, acarreta enormes passivos futuros para limpeza e tratamento de água.

Ensinando um agente digital a escavar

Os pesquisadores reformularam o projeto da cava como um problema de aprendizado, em vez de um cálculo único. Eles dividem o corpo mineral em milhares de blocos tridimensionais, cada um com sua própria receita, custo de mineração, custo de processamento e um custo ambiental cuidadosamente estimado por tonelada de minério e de estéril. Um “agente” computacional então pratica a mineração desses blocos passo a passo dentro de uma mina simulada. Quando escolhe blocos que aumentam o valor total respeitando ângulos de talude seguros, recebe uma recompensa positiva; quando viola regras de talude ou persegue blocos que se tornam não lucrativos uma vez incluídos os impactos ambientais, é penalizado. Ao longo de muitos ciclos de treinamento, o agente usa Q-learning para descobrir um padrão de mineração — uma política — que equilibra lucro com menor geração de estéril e menos encargos ambientais.

Figure 1
Figure 1.

De modelos de brinquedo a uma grande cava de cobre

Para testar a ideia, a equipe aplicou primeiro a estrutura de Q-learning a pequenos depósitos de teste em duas e três dimensões. Nesses experimentos, o agente digital melhorou gradualmente sua estratégia: as formas iniciais das cavas eram irregulares e ineficientes, mas após milhares de passos de aprendizado as cavidades tornaram-se suaves, realistas e economicamente viáveis. A mudança chave foi que, uma vez incorporados os custos ambientais ao valor de cada bloco, muitos blocos marginais que antes pareciam atraentes passaram a representar perdas líquidas, de modo que o agente aprendeu a deixá-los no subsolo. Importante: as cavas resultantes extraiam quase a mesma quantidade de minério, mas exigiram menos remoção de rocha estéril.

Mineração no mundo real, concessões do mundo real

A prova prática veio da aplicação do método à mina de cobre Sarcheshmeh, no Irã, uma das maiores operações de cobre do país. O novo projeto baseado em Q-learning foi comparado com o algoritmo padrão da indústria Lerchs–Grossmann, que otimiza puramente o retorno financeiro. O projeto tradicional produziu um lucro ligeiramente maior no papel, mas o fez ao negligenciar os custos ambientais. O projeto com Q-learning, em contraste, reduziu a rocha estéril em milhões de toneladas enquanto recuperou quase exatamente a mesma quantidade de minério. Também foi mais rápido no mesmo computador, reduzindo o tempo de otimização em cerca de 20%. O resultado final foi uma cava um pouco menor e mais compacta que perturbava menos terreno e exporia menos material capaz de gerar escoamento ácido, sem sacrificar receita significativa.

Figure 2
Figure 2.

Repensando o que “lucro” realmente significa

Para não-especialistas, a mensagem principal é que a forma como projetamos minas pode alterar dramaticamente sua pegada de longo prazo, mesmo que os lucros de curto prazo pareçam semelhantes. Ao ensinar um algoritmo a tratar o dano ambiental como um custo real desde o primeiro passo do projeto, o estudo mostra que é possível minerar quase tanto metal enquanto movimenta menos rocha, deixando uma cicatriz menor e, provavelmente, pagando menos pela limpeza depois. Em outras palavras, a mina mais inteligente não é aquela que extrai cada centavo hoje, mas a que reconhece que a conta da natureza eventualmente chegará — e planeja de acordo.

Citação: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w

Palavras-chave: mineração a céu aberto, rocha estéril, aprendizado por reforço, mineração sustentável, projeto de mina