Clear Sky Science · pl

Podejście Q-learning do redukcji skały odpadowej w projektowaniu kopalń odkrywkowych oparte na zasadach czystszej produkcji

2026-01-28 · Powrót do spisu

Dlaczego inteligentniejsze kopalnie mają znaczenie

Współczesne społeczeństwo opiera się na metalach, od miedzi w naszych telefonach po okablowanie w sieciach elektroenergetycznych. Pozyskiwanie tych metali często oznacza jednak wycinanie ogromnych odkrywek w ziemi i przemieszczanie olbrzymich mas skały. Większość tej skały to odpady, które trzeba transportować, składować i monitorować przez dziesięciolecia. W niniejszym badaniu omówiono nowy sposób projektowania kopalń odkrywkowych wykorzystujący sztuczną inteligencję, a konkretnie metodę zwaną Q-learning, w celu zmniejszenia ilości skały odpadowej i jej skutków środowiskowych, przy zachowaniu opłacalności wydobycia.

Ukryty koszt przemieszczania gór

W typowej odkrywce miedzi inżynierowie najpierw definiują granice ostatecznej odkrywki — zewnętrzną powłokę skały, której usunięcie jest opłacalne w czasie życia kopalni. Wewnątrz tej powłoki znajduje się ruda zawierająca cenny metal; na zewnątrz — skała, której wydobycie byłoby zbyt kosztowne. Tradycyjne metody projektowania koncentrują się prawie wyłącznie na zyskach ze sprzedaży metalu pomniejszonych o bezpośrednie koszty wiercenia, strzałowania, transportu i przetwarzania. W dużej mierze pomijają długoterminowe rachunki środowiskowe związane z postępowaniem z odpadami skalnymi, takie jak degradacja terenu, zanieczyszczenie czy ryzyko kwaśnych ścieków kopalnianych. W rezultacie odkrywka może wyglądać atrakcyjnie na papierze, jednocześnie składając w czasie ogromne przyszłe zobowiązania związane z rekultywacją i uzdatnianiem wód.

Nauczanie cyfrowego agenta kopania

Badacze przedstawili projekt odkrywki jako problem uczenia, a nie jednorazowe obliczenie. Dzielą złoże na tysiące trójwymiarowych bloków, z których każdy ma przypisaną przychód, koszt wydobycia, koszt przetworzenia oraz starannie oszacowany koszt środowiskowy na tonę rudy i odpadów. Komputerowy „agent” następnie ćwiczy wydobycie tych bloków krok po kroku w symulowanej kopalni. Gdy wybiera bloki zwiększające całkowitą wartość przy zachowaniu bezpiecznych kątów skarp, otrzymuje dodatnią nagrodę; gdy narusza zasady nachylenia lub goni za blokami, które po uwzględnieniu skutków środowiskowych stają się nieopłacalne, jest karany. W wielu cyklach treningowych agent używa Q-learningu, by odkryć wzorzec wydobycia — politykę — która równoważy zysk z mniejszą ilością odpadów i niższym obciążeniem środowiska.

Od modeli zabawkowych do olbrzymiej odkrywki miedzi

Aby przetestować pomysł, zespół najpierw zastosował ramy Q-learning do małych dwuwymiarowych i trójwymiarowych złóż testowych. W tych eksperymentach cyfrowy agent stopniowo udoskonalał swoją strategię: wczesne kształty odkrywek były ząbkowane i nieefektywne, ale po tysiącach kroków uczenia odkrywki stały się gładkie, realistyczne i ekonomicznie uzasadnione. Kluczowa zmiana polegała na tym, że po włączeniu kosztów środowiskowych do wartości każdego bloku wiele marginalnych bloków, które wcześniej wyglądały atrakcyjnie, okazało się być stratą netto, więc agent nauczył się pozostawiać je w gruncie. Co ważne, wygenerowane odkrywki wydobywały niemal taką samą ilość rudy, lecz wymagały mniejszego usunięcia skały odpadowej.

Rzeczywiste górnictwo, rzeczywiste kompromisy

Prawdziwe potwierdzenie przyszło po zastosowaniu metody do kopalni miedzi Sarcheshmeh w Iranie, jednej z największych operacji miedziowych w kraju. Nowy projekt oparty na Q-learning porównano ze standardowym w przemyśle algorytmem Lerchsa–Grossmanna, który optymalizuje wyłącznie zwrot finansowy. Tradycyjny projekt generował nieco wyższy zysk na papierze, ale osiągał to kosztem pomijania kosztów środowiskowych. Projekt oparty na Q-learning zredukował natomiast skałę odpadową o miliony ton, odzyskując niemal dokładnie taką samą ilość rudy. Działał też szybciej na tym samym komputerze, skracając czas optymalizacji o około 20 procent. Efektem końcowym była nieco mniejsza, bardziej zwarta odkrywka, która zakłóciłaby mniej terenu i wystawiłaby na działanie mniejszą ilość materiału zdolnego generować kwaśne spływy, bez utraty istotnych przychodów.

Ponowne przemyślenie, co naprawdę oznacza „zysk”

Dla niespecjalistów główne przesłanie jest takie, że sposób, w jaki projektujemy kopalnie, może dramatycznie zmienić ich długoterminowy ślad, nawet jeśli krótkoterminowe zyski wyglądają podobnie. Ucząc algorytm traktować szkody środowiskowe jako realny koszt już na etapie projektowania, badanie pokazuje, że możliwe jest wydobycie prawie takiej samej ilości metalu przy przemieszczaniu mniejszej ilości skały, pozostawieniu mniejszego śladu i prawdopodobnie niższych kosztach rekultywacji w przyszłości. Innymi słowy, najmądrzejsza kopalnia to nie ta, która wyciska zyski do ostatniego dolara dziś, lecz ta, która uznaje, że rachunek natury w końcu przyjdzie — i planuje z wyprzedzeniem.

Cytowanie: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w

Słowa kluczowe: kopalnictwo odkrywkowe, skała odpadowa, uczenie przez wzmacnianie, zrównoważone górnictwo, projektowanie kopalni