Clear Sky Science · he
שיטת Q-learning לצמצום סלעי בזבוז בתכנון מכרה פתוח המבוססת על עקרונות ייצור נקי
מדוע מכרות חכמים חשובים
החברה המודרנית פועלת על מתכות, מהנחושת שבטלפון שלנו ועד הכבלים ברשתות החשמל. השגת המתכות האלה, עם זאת, לעתים קרובות משמעותה חציבה של בורות פתוחים עצומים והזזת כמויות אדירות של סלע. רוב הסלע הזה הוא פסולת שצריך להוביל, להטמין ולנטר במשך עשורים. המחקר הזה בוחן דרך חדשה לתכנון מכרות פתוחים המשתמשת בבינה מלאכותית, ובפרט בשיטה הנקראת Q-learning, כדי להפחית סלעי בזבוז ואת הנזק הסביבתי שלהם תוך שמירה על רווחיות המכרות.
עלות סמויה של הזזת הרים
במכרה נחושת טיפוסי פתוח, מהנדסים מגדירים קודם את גבול המכרה הסופי — מעטפת החוצה של הסלע ששווה לחצוב לאורך חיי המכרה. בתוך מעטפת זו נמצא העפרה המכילה מתכת בעלת ערך; מחוצה לה נמצא סלע שהעלות לחצוב אותו גבוהה מדי. שיטות תכנון מסורתיות מתמקדות בעיקר בהכנסות ממכירת המתכת פחות עלויות ישירות של קידוח, פיצוץ, הובלה ועיבוד. הן מתעלמות ברובן מחשבונות סביבתיים לטווח הארוך לטיפול בפסולת סלע, כמו הידרדרות קרקע, זיהום וסיכון לנגר ארסי ממכרות. כתוצאה מכך, מכרה יכול להראות אטרקטיבי על הנייר בעוד שבפועל הוא מנעול החזיק אחריו חבות עתידית גדולה לניקוי וטיפול במים.
להכשיר סוכן דיגיטלי לחציבה
החוקרים שינו את הבעיה של תכנון המכרה מבעיה של חישוב חד־פעמי לבעיה של למידה. הם חלקו את גוש העפרה לאלפי בלוקים תלת־ממדיים, כל אחד עם הכנסה משלו, עלות חציבה, עלות עיבוד והערכת עלות סביבתית זהירה לטון של עפרה ופסולת. סוכן מחשב אז מתרגל לחצוב את הבלוקים האלה שלב אחר שלב בתוך מכרה מדומה. כשהוא בוחר בלוקים שמעלים את הערך הכולל תוך שמירה על זוויות קיר בטוחות, הוא מקבל חיזוק חיובי; כשהוא מפר כללי שיפוע או רודף אחרי בלוקים שהופכים ללא רווחיים לאחר שמחשבים השפעות סביבתיות, הוא מקבל עונש. במשך מחזורי אימון רבים משתמש הסוכן ב-Q-learning כדי לגלות דפוס חציבה — מדיניות — שמתאזנת בין רווח לבין הפחתת פסולת ונשיאת נטל סביבתי נמוכה יותר.

ממודלים פשוטים עד לבור נחושת ענק
כדי לבחון את הרעיון, הצוות יישם תחילה את מסגרת ה-Q-learning על מאגרי ניסוי דו־ממדיים ותלת־ממדיים קטנים. בניסויים אלה שיפר הסוכן הדיגיטלי בהדרגה את האסטרטגיה שלו: צורות הבור המוקדמות היו משוננות ולא יעילות, אבל לאחר אלפי צעדי למידה הבורות הפכו חלקים, ריאליסטיים וכלכלית סבירים. השינוי המכריע היה שגם כשהעלויות הסביבתיות נכללו בערך של כל בלוק, הרבה בלוקים שברו פעם נראו אטרקטיביים הפכו להפסדים נטו, ולכן הסוכן למד להשאירם באדמה. חשוב לציין שהבורים שהתקבלו חצבו כמעט את אותה כמות עפרה אך דרשו פחות הסרת סלע בזבוז.
כרייה בעולם האמיתי, וויתורים בעולם האמיתי
ההוכחה המעשית הגיעה מיישום השיטה במכרה הנחושת סארצ'שמה באיראן, אחד מפעולות הנחושת הגדולות במדינה. התכנון החדש המבוסס על Q-learning הושווה עם אלגוריתם הסטנדרט בתעשייה Lerchs–Grossmann, שממקסם החזר כספי בלבד. התכנון המסורתי הניב רווח מעט גבוה יותר על הנייר אך עשה זאת תוך התעלמות מעלויות סביבתיות. לעומת זאת, תכנון ה-Q-learning צמצם את סלעי הבזבוז במיליוני טונות בעוד שחזר כמעט בדיוק את אותה כמות עפרה. הוא גם רץ מהר יותר על אותו מחשב, והקטין את זמן האופטימיזציה בכשיעור של כ-20 אחוז. התוצאה הסופית הייתה בור מעט קטן וצפוף יותר שהפריע פחות לקרקע וחשף פחות חומר שיכול לייצר נגר ארסי, בלי לוותר על הכנסות משמעותיות.

לחשוב מחדש מה באמת פירושו "רווח"
לקהל שאינו מומחה, המסר העיקרי הוא שדרך תכנון המכרות יכולה לשנות דרמטית את טביעת הרגל שלהם בטווח הארוך, גם אם הרווחים הקצרים נראים דומים. על ידי לימוד אלגוריתם להתייחס לנזק סביבתי כעלות ממשית משלב התכנון הראשון, המחקר מראה שאפשר לחלץ כמעט את אותו כמות מתכת בזמן שמזיזים פחות סלע, משאירים צלקת קטנה יותר ובסבירות גבוהה משלמים פחות על ניקוי מאוחר יותר. במילים אחרות, המכרה החכם ביותר אינו זה שמוצץ כל דולר אחרון היום, אלא זה שמכיר בכך שחשבון הטבע בסופו של דבר יגיע — ומתכנן בהתאם.
ציטוט: Badakhshan, N., Bakhtavar, E., Shahriar, K. et al. A Q-learning approach to waste rock reduction in open-pit mine design based on cleaner production principles. Sci Rep 16, 6447 (2026). https://doi.org/10.1038/s41598-026-35892-w
מילות מפתח: כרייה פתוחה, סלע בזבוז, למידת חיזוק, כרייה בת קיימא, תכנון מכרה