Clear Sky Science · tr

Veri kıtlığı altında mineral yatak potansiyeli haritalaması için topluluk makine öğrenimi stratejileri

2026-02-15 · Dizine geri dön

Daha Az İpucuyla Cevher Bulmak

Modern toplum, piller, elektronik ve altyapı için kurşun ve çinko gibi metallere bağımlıdır; ancak en kolay erişilebilen yataklar zaten bulunmuştur. Yeni bölgelerde jeologların yol gösterici olarak elinde genellikle sadece birkaç doğrulanmış mineral keşfi, dağınık kimyasal örnekler ve parçalı haritalar olur. Bu çalışma, makine öğrenimini geçmiş veride mümkün olan en yüksek skoru kovalamak için değil, bilgi kıt olduğunda karar vericilerin gerçekten güvenebileceği tahminler sunmak için nasıl kullanacağımızı gösterir.

Gerçekte Verilerin Neden Seyrek Olduğu

Mineral yatak potansiyeli haritalaması, bir arazinin hangi bölümlerinin cevher içermeye daha yatkın olduğunu vurgulamayı amaçlar. Bunu kayaç türleri, faylar, uydu görüntüleri ve akarsu tortusu kimyası gibi bilgi katmanlarını birleştirerek saha çalışmaları ve sondajı yönlendiren olasılık haritasına dönüştürür. Ancak erken aşama projelerde yalnızca birkaç yatak bilinir ve haritanın birçok bölümü hiç örneklenmemiştir. Standart makine öğrenimi araçları büyük, iyi etiketlenmiş veri setlerinde başarılıdır; yalnızca birkaç düzine pozitif örnekle karşılaştıklarında kararsız ve aşırı kendinden emin hale gelebilir, hassas görünen ama gerçeklikle zayıf ilişki kuran sayılar üretebilirler.

Seyrek İpuçlarını Kullanılabilir Sinyallere Çevirmek

Yazarlar, mineralizasyonun belirli kireçtaşı katmanları, faylar ve kimyasal değişim zonlarıyla ilişkili olduğu İran’ın merkezindeki Dehaq kurşun–çinko bölgesinde çalıştılar. Jeolojik haritalar ve uydu görüntülerinden konak kayaçlar, kırık yoğunluğu ve alterasyonun dijital haritalarını oluşturdular ve 624 tortu örneğinden jeokimyasal anomalileri çıkardılar. Bu zengin ama düzensiz kanıttan yalnızca 108 etiketli konum elde ettiler: 27’si bilinen yataklı, 81’i yataksız. Çoğunluk sınıfının az sayıdaki cevher örneğini bastırmasını önlemek için, eğitim verileri içinde sadece sınıfları dengeleyen, mevcut yataklar arasında interpolasyon yaparak gerçekçi sentetik yatak noktaları oluşturan bir teknik kullandılar. Bu, ayrı doğrulama ve test setlerini gerçek dünyadaki nadirliği yansıtacak şekilde korurken daha dengeli bir örnek seti sağladı.

Bir Kahramana Değil, Modeller Takımına Yatırım

Tek bir algoritmaya güvenmek yerine çalışma, farklı güçlü yönlere sahip yöntemleri eşleştirdi. Bir topluluk, sınıflar arasında mümkün olan en keskin ayrımı çizen destek vektör makinesini (SVM) ve Gaussian Naive Bayes adı verilen basit bir olasılıksal modeli birleştirdi. Diğeri ise çok sayıda değişkendeki karmaşık desenleri yakalamada başarılı LightGBM ve AdaBoost adlı iki ağaç tabanlı yöntemi harmanladı. Her iki durumda da nihai tahmin, bileşen modellerin olasılık tahminlerinin ortalamasıydı; bu strateji genellikle performanstaki aşırı dalgalanmaları azaltır. Kritik olarak, yazarlar modellerin ne kadar sık doğru olduğuna bakmakla kalmayıp, aynı zamanda tahmin ettikleri olasılıkların gerçekteki oranlarla ne kadar iyi eşleştiğini—kalibrasyon olarak bilinen bir özelliği—karşılaştırdılar.

Skor İçin Değil, Güven İçin Ayarlama

Bir modelin ayarlarını seçmek—hataları ne kadar güçlü cezalandırdığı, kaç ağaç büyüttüğü vb.—davranışını dramatik şekilde değiştirebilir. Ekip üç yaygın ayar stratejisini test etti: sabit bir seçenek menüsünü sistematik tarayan Grid Search; kombinasyonları rastgele örnekleyen Random Search; ve önceki denemeleri kullanarak vaat eden yeni kombinasyonları tahmin eden Bayesian Optimization. Kağıt üzerinde, Bayesian Optimization destek-vektör tabanlı topluluk için tekil en yüksek ayrım skorunu (ROC–AUC 0,95) sağladı. Yine de yazarlar, tahmin edilen olasılıkları gerçek sonuçlarla karşılaştıran kalibrasyon eğrilerini incelediklerinde, her iki topluluğun da Grid Search sürümlerinin özellikle keşif eşiklerinin genellikle ayarlandığı orta olasılık aralığında daha düzgün ve daha stabil sonuçlar ürettiğini gördüler.

Sayılar Sahaya Nasıl Dönüşür

Her sondaj deliğinin pahalı olduğu erken keşifte, yazarlar iyi davranan olasılıkların küçük bir doğruluk artışını zorlamak yerine daha önemli olduğunu savunuyor. En pratik önerileri, Grid Search ile ayarlanmış daha basit destek-vektör artı Bayes topluluğudur. Bu yöntem güçlü ayrımcılık sağlarken olasılık değerleri ile gerçek keşif oranları arasındaki en güvenilir bağı sunar; bu da jeologların risk toleranslarına uyan eşik değerleri belirlemelerine olanak verir. Projeler olgunlaştıkça ve daha fazla veri biriktikçe, LightGBM topluluğu gibi daha karmaşık ağaç tabanlı modeller tahminleri rafine etmek için devreye sokulabilir, ancak her zaman kalibrasyona dikkat edilmelidir. Bu şekilde makine öğrenimi, kara kutu puan üreten bir araç olmaktan çıkar; bir sonraki nesil mineral kaynaklarını arama konusunda risk bilincine sahip kararlar almada şeffaf bir ortak haline gelir.

Atıf: Amirajlo, P., Hassani, H., Pour, A.B. et al. Ensemble machine learning strategies for mineral prospectivity mapping under data scarcity. Sci Rep 16, 9171 (2026). https://doi.org/10.1038/s41598-026-40125-1

Anahtar kelimeler: mineral yatak potansiyeli haritalaması, topluluk (ensemble) makine öğrenimi, veri kıtlığı, model kalibrasyonu, maden arama