Clear Sky Science · fr

Une approche par Q-learning pour réduire les stériles dans la conception des mines à ciel ouvert basée sur les principes de production plus propre

2026-01-28 · Retour à l’index

Pourquoi des mines plus intelligentes comptent

La société moderne fonctionne grâce aux métaux, du cuivre dans nos téléphones au câblage des réseaux électriques. Obtenir ces métaux implique toutefois souvent de creuser d’énormes fosses à ciel ouvert et de déplacer des quantités colossales de roche. La plupart de cette roche est un déchet qui doit être transporté, stocké et surveillé pendant des décennies. Cette étude explore une nouvelle façon de concevoir les mines à ciel ouvert en utilisant l’intelligence artificielle, plus précisément une méthode appelée Q-learning, pour réduire les stériles et leurs dommages environnementaux tout en maintenant la rentabilité des mines.

Le coût caché du déplacement des montagnes

Dans une mine de cuivre à ciel ouvert typique, les ingénieurs définissent d’abord la limite ultime de la fosse — l’enveloppe extérieure de roche dont l’extraction est rentable sur la durée de vie de la mine. À l’intérieur de cette enveloppe se trouve le minerai contenant le métal précieux ; à l’extérieur se trouve la roche dont l’exploitation est trop coûteuse. Les méthodes de conception traditionnelles se concentrent presque exclusivement sur l’argent tiré de la vente du métal moins les coûts directs de forage, de dynamitage, de transport et de traitement. Elles ignorent en grande partie les factures environnementales à long terme liées aux stériles, comme la dégradation des terres, la pollution et le risque de drainage minier acide. En conséquence, une fosse peut paraître attractive sur le papier tout en verrouillant silencieusement d’énormes responsabilités futures pour le nettoyage et le traitement des eaux.

Apprendre à une entité numérique à creuser

Les chercheurs ont reformulé la conception de la fosse comme un problème d’apprentissage plutôt que comme un calcul ponctuel. Ils divisent le gisement en milliers de blocs tridimensionnels, chacun avec son propre revenu, son coût d’extraction, son coût de traitement et un coût environnemental estimé au tonneau pour le minerai et les stériles. Un « agent » informatique s’entraîne ensuite à extraire ces blocs pas à pas dans une mine simulée. Lorsqu’il choisit des blocs qui augmentent la valeur globale tout en respectant les angles de paroi sûrs, il obtient une récompense positive ; lorsqu’il viole les règles de pente ou poursuit des blocs qui deviennent non rentables une fois les impacts environnementaux pris en compte, il est pénalisé. Au fil de nombreux cycles d’apprentissage, l’agent utilise le Q-learning pour découvrir un schéma d’exploitation — une politique — qui équilibre le profit avec une réduction des stériles et des charges environnementales moindres.

Des modèles-jouets à une immense fosse de cuivre

Pour tester l’idée, l’équipe a d’abord appliqué le cadre Q-learning à de petits gisements tests en deux et trois dimensions. Dans ces expériences, l’agent numérique a progressivement amélioré sa stratégie : les formes de fosses initiales étaient dentelées et inefficaces, mais après des milliers d’étapes d’apprentissage les fosses sont devenues lisses, réalistes et économiquement viables. Le changement clé a été que, une fois les coûts environnementaux intégrés à la valeur de chaque bloc, de nombreux blocs marginaux qui semblaient auparavant attractifs sont devenus des pertes nettes, et l’agent a appris à les laisser dans le sol. Il est important de noter que les fosses résultantes extrayaient presque la même quantité de minerai tout en nécessitant moins de déblais à enlever.

Exploitation réelle, compromis réels

La preuve concrète est venue de l’application de la méthode à la mine de cuivre de Sarcheshmeh en Iran, l’une des plus grandes exploitations de cuivre du pays. La nouvelle conception basée sur le Q-learning a été comparée à l’algorithme standard de l’industrie Lerchs–Grossmann, qui optimise uniquement le rendement financier. La conception traditionnelle produisait sur le papier un profit légèrement supérieur mais le faisait en négligeant les coûts environnementaux. La conception par Q-learning, en revanche, a réduit les stériles de plusieurs millions de tonnes tout en récupérant presque exactement la même quantité de minerai. Elle a également été plus rapide sur la même machine, réduisant le temps d’optimisation d’environ 20 %. Le résultat final était une fosse quelque peu plus petite et plus compacte qui perturberait moins les terres et exposerait moins de matériaux susceptibles de générer des écoulements acides, sans sacrifier des revenus significatifs.

Repenser ce que « profit » signifie vraiment

Pour les non-spécialistes, le message principal est que la façon dont nous concevons les mines peut radicalement modifier leur empreinte à long terme, même si les profits à court terme semblent similaires. En apprenant à un algorithme à traiter les dommages environnementaux comme un coût réel dès la première étape de conception, l’étude montre qu’il est possible d’extraire presque autant de métal tout en déplaçant moins de roche, en laissant une cicatrice plus petite et en payant probablement moins pour le nettoyage ultérieur. En d’autres termes, la mine la plus intelligente n’est pas celle qui extrait chaque dernier dollar aujourd’hui, mais celle qui reconnaît que la facture de la nature finira par arriver — et qui planifie en conséquence.

Citation: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w

Mots-clés: exploitation à ciel ouvert, stériles, apprentissage par renforcement, exploitation minière durable, conception de mine