Clear Sky Science · ru

Подход Q-обучения к сокращению пустой породы при проектировании карьерных рудников на основе принципов производственного экологического благополучия

2026-01-28 · Назад к списку

Почему умные рудники важны

Современное общество работает на металлах — от меди в наших телефонах до проводки в энергосистемах. Добыча этих металлов часто подразумевает выемку огромных открытых карьеров и перемещение колоссальных объёмов пород. Большая часть этих пород — отходы, которые десятилетиями нужно вывозить, складировать и контролировать. В этом исследовании рассматривается новый способ проектирования карьеров с использованием искусственного интеллекта, в частности метода, называемого Q-обучением, чтобы сократить объёмы пустой породы и её экологический ущерб, при этом сохраняя экономическую привлекательность добычи.

Скрытая цена перемещения гор

В типичном открытом медном карьере инженеры сначала определяют предельный контур карьера — внешнюю оболочку пород, которые стоит извлекать в течение срока эксплуатации рудника. Внутри этой оболочки находится руда с ценным металлом; снаружи — порода, добыча которой слишком дорога. Традиционные методы проектирования ориентируются почти исключительно на денежный доход от продажи металла за вычетом прямых затрат на бурение, взрывные работы, вывоз и переработку. Они в значительной степени игнорируют долгосрочные экологические расходы по обращению с пустой породой, такие как деградация земель, загрязнение и риск кислотных стоков. В результате карьер может выглядеть привлекательным на бумаге, при этом фактически создавая значительные будущие обязательства по очистке и водоочистке.

Обучая цифрового агента копать

Исследователи представили задачу проектирования карьера как задачу обучения, а не как одноразовый расчёт. Они разбивают рудное тело на тысячи трёхмерных блоков, у каждого из которых учтены собственные доходы, затраты на добычу, переработку и тщательно оценённая экологическая стоимость на тонну руды и отходов. «Агент» в компьютере затем отрабатывает добычу этих блоков шаг за шагом в смоделированном карьере. Когда он выбирает блоки, повышающие общую ценность при соблюдении безопасных углов откосов, он получает положительное вознаграждение; если нарушает правила откоса или гонится за блоками, которые становятся убыточными после учёта экологических последствий, он получает штраф. За многие циклы обучения агент с помощью Q-обучения находит стратегию — политику — которая балансирует прибыль с уменьшением объёмов отходов и экологических нагрузок.

От упрощённых моделей к гигантскому медному карьеру

Для проверки идеи команда сначала применила Q-обучение к небольшим двумерным и трёхмерным тестовым залежам. В этих экспериментах цифровой агент постепенно улучшал стратегию: ранние очертания карьера были зазубренными и неэффективными, но после тысяч шагов обучения карьеры становились гладкими, реалистичными и экономически обоснованными. Ключевое изменение заключалось в том, что при включении экологических затрат в ценность каждого блока многие маргинальные блоки, которые раньше казались привлекательными, превратились в чистые убытки, и агент научился оставлять их в земле. Важно, что получившиеся карьеры добывали почти тот же объём руды, но требовали меньше выемки пустой породы.

Реальная добыча — реальные компромиссы

Настоящим подтверждением стал случай применения метода к медному руднику Сарчешме в Иране, одному из крупнейших в стране. Новый дизайн на основе Q-обучения сравнили со стандартным в отрасли алгоритмом Лерча–Гроссмана, который оптимизирует исключительно финансовую отдачу. Традиционный дизайн на бумаге давал слегка большую прибыль, но делал это за счёт игнорирования экологических затрат. Дизайн на основе Q-обучения, напротив, сократил объёмы пустой породы на миллионы тонн, при этом обеспечив почти тот же объём извлечённой руды. Он также работал быстрее на том же компьютере, сокращая время оптимизации примерно на 20 процентов. В результате получился несколько меньший и более компактный карьер, который нарушил бы меньше земель и оголил бы меньше материалов, способных генерировать кислотные стоки, без существенной потери дохода.

Переосмысление того, что такое «прибыль»

Для неспециалистов главным посылом является то, что способ проектирования рудников может кардинально изменить их долгосрочный след, даже если краткосрочные прибыли выглядят схожими. Научив алгоритм рассматривать экологический ущерб как реальную стоимость с самого первого шага проектирования, исследование показывает: можно добывать почти столько же металла, двигая при этом меньше пород, оставляя меньший след и, вероятно, экономя на последующей очистке. Иными словами, самый умный рудник — это не тот, который выжимает каждую последнюю копейку сегодня, а тот, который признаёт, что счёт природы рано или поздно придёт — и планирует это заранее.

Цитирование: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w

Ключевые слова: карьерная добыча, пустая порода, обучение с подкреплением, устойчивая добыча, проектирование рудника