Clear Sky Science · it
Un approccio di Q-learning alla riduzione della roccia di scarto nella progettazione di miniere a cielo aperto basato sui principi della produzione più pulita
Perché le miniere più intelligenti contano
La società moderna dipende dai metalli, dal rame nei nostri telefoni ai cablaggi delle reti elettriche. Ottenere questi metalli, però, spesso significa scavare enormi cave a cielo aperto e spostare quantità impressionanti di roccia. La maggior parte di questa roccia è scarto che deve essere trasportato, scaricato e monitorato per decenni. Questo studio esplora un nuovo modo di progettare miniere a cielo aperto che usa l’intelligenza artificiale, in particolare un metodo chiamato Q-learning, per ridurre la roccia di scarto e i suoi impatti ambientali pur mantenendo la redditività delle miniere.
Il costo nascosto dello spostare le montagne
In una tipica miniera di rame a cielo aperto, gli ingegneri definiscono prima il limite finale della cava—l’involucro esterno di roccia che vale la pena rimuovere nel corso della vita della miniera. All’interno di quell’involucro si trova il minerale contenente metallo prezioso; all’esterno c’è roccia che costa troppo da estrarre. I metodi tradizionali di progettazione si concentrano quasi esclusivamente sul denaro ricavato dalla vendita del metallo meno i costi diretti di perforazione, esplosione, trasporto e processamento. Ignorano in gran parte i conti ambientali a lungo termine per gestire la roccia di scarto, come il degrado del suolo, l’inquinamento e il rischio di drenaggio acido delle miniere. Di conseguenza, una cava può apparire attraente sulla carta, mentre silenziosamente determina enormi responsabilità future per bonifiche e trattamento delle acque.
Insegnare a un agente digitale a scavare
I ricercatori hanno ripensato la progettazione della cava come un problema di apprendimento anziché come un calcolo una tantum. Hanno suddiviso il giacimento in migliaia di blocchi tridimensionali, ciascuno con il proprio ricavo, costo di estrazione, costo di lavorazione e un costo ambientale stimato per tonnellata di minerale e di scarto. Un “agente” informatico quindi esercita l’estrazione di questi blocchi passo dopo passo all’interno di una miniera simulata. Quando sceglie blocchi che aumentano il valore complessivo rispettando gli angoli di parete sicuri ottiene una ricompensa positiva; quando viola le regole di pendenza o insegue blocchi che diventano non redditizi una volta considerati gli impatti ambientali viene penalizzato. Nel corso di molti cicli di addestramento, l’agente usa il Q-learning per scoprire un modello di estrazione—una politica—che bilancia il profitto con una minore produzione di scarto e minori oneri ambientali.

Da modelli giocattolo a una gigantesca cava di rame
Per testare l’idea, il team ha applicato inizialmente il quadro di Q-learning a piccoli depositi di prova bidimensionali e tridimensionali. In questi esperimenti l’agente digitale ha gradualmente migliorato la sua strategia: le prime forme delle cave erano frastagliate e inefficienti, ma dopo migliaia di passi di apprendimento le cave sono diventate lisce, realistiche e solide dal punto di vista economico. La variazione chiave è stata che una volta che i costi ambientali sono stati incorporati nel valore di ciascun blocco, molti blocchi marginali che prima sembravano attraenti si sono trasformati in perdite nette, quindi l’agente ha imparato a lasciarli nel terreno. È importante notare che le cave risultanti estraevano quasi la stessa quantità di minerale ma richiedevano meno rimozione di roccia di scarto.
Estrazione reale, compromessi reali
La prova concreta è arrivata applicando il metodo alla miniera di rame di Sarcheshmeh in Iran, una delle maggiori operazioni di rame del paese. Il nuovo progetto basato su Q-learning è stato confrontato con l’algoritmo standard del settore Lerchs–Grossmann, che ottimizza esclusivamente il rendimento finanziario. Il progetto tradizionale produceva un profitto leggermente superiore sulla carta ma lo faceva trascurando i costi ambientali. Il progetto con Q-learning, al contrario, ha ridotto la roccia di scarto di milioni di tonnellate pur recuperando quasi esattamente la stessa quantità di minerale. Inoltre è stato più veloce sullo stesso computer, riducendo i tempi di ottimizzazione di circa il 20 percento. Il risultato finale è stata una cava leggermente più piccola e compatta che disturberebbe meno terreno ed esporrebbe meno materiale capace di generare deflussi acidi, senza sacrificare ricavi significativi.

Riconsiderare cosa significa davvero “profitto”
Per i non specialisti, il messaggio principale è che il modo in cui progettiamo le miniere può cambiare drasticamente la loro impronta a lungo termine, anche se i profitti a breve termine appaiono simili. Insegnando a un algoritmo a considerare il danno ambientale come un costo reale fin dal primo passo di progettazione, lo studio mostra che è possibile estrarre quasi la stessa quantità di metallo spostando meno roccia, lasciando una cicatrice più piccola e probabilmente pagando meno per le bonifiche in seguito. In altre parole, la miniera più intelligente non è quella che strizza ogni ultimo dollaro oggi, ma quella che riconosce che il conto della natura arriverà prima o poi—e pianifica di conseguenza.
Citazione: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w
Parole chiave: estrazione a cielo aperto, roccia di scarto, apprendimento per rinforzo, estrazione sostenibile, progettazione di miniere