Clear Sky Science · tr
YOLOv8-EST tabanlı kömür ocağında çalışılan yüz durumu tespiti
Yeraltında daha akıllı gözler
Modern kömür ocakları, insan görüşünün zayıf olduğu ve güvenlik marjlarının dar olduğu karanlık, tozlu tünellerde çalışan güçlü makinelerle doludur. Bu çalışma, YOLOv8-EST adını verdikleri yeni bir yapay zeka (YZ) sistemi tanıtıyor; sistem, ocağın üzerinde aktif olarak kömürün kesildiği çalışma yüzünü sürekli “izlemeye” yardımcı oluyor ve ana makinelerin normal çalışıp çalışmadığını otomatik olarak değerlendirebiliyor. Sınırlı saha bilgisayarlarında hızlı ve doğru şekilde çalışarak, pahalı sunucu odalarına ihtiyaç duymadan güvenlik ve verimliliği artırmayı hedefliyor.
Çalışma yüzünü izlemenin önemi
Çin dünya çapında en büyük kömür üreticisidir ve madenleri daha güvenli, daha temiz ve daha verimli olma baskısı altındadır. Tam mekanize bir çalışma yüzünde dönen kesme tamburu damarından kömürü dilimleyip ayırırken, kazı bandı ve bant konveyörler bunu uzaklaştırır ve püskürtme sistemleri tozu bastırır. Bu bileşenlerden herhangi biri arızalanır veya anormal davranırsa üretim düşebilir ve kazalar meydana gelebilir. Geleneksel izleme büyük ölçüde işçilerin deneyimine ve basit sensörlere dayanır; bunlar düşük ışık, sürüklenen toz, parlama ve hareketli ekipman tarafından sık sık örtünme gibi koşullarla başa çıkmakta zorlanır. Yazarlar, “çalışma yüzü durumu tespiti”ni yalnızca video görüntülerini kullanarak bu ana bileşenlerin normal ve anormal durumlarının gerçek zamanlı tanımlanması şeklinde tanımlıyor—bu, gerçekten akıllı madenlere doğru cazip bir yol sunuyor.

Madenlerde mevcut YZ görselliğinin sınırlılıkları
Son yıllarda YOLO (You Only Look Once) ailesi gibi hızlı sistemlerle özellikle nesne tespitinde YZ tabanlı başarılı gelişmeler yaşandı. Bu modeller bir görüntüde birçok nesneyi saniyenin kesirleri içinde tespit edip etiketleyebiliyor. Ancak doğruluktaki çoğu ilerleme ağları daha derin ve daha ağır hale getirmekten geldi ve bu da çalışma yüzünde genellikle bulunmayan daha fazla hesaplama gücü gerektiriyor. Faster R-CNN, RetinaNet, EfficientDet gibi alternatif algılayıcılar ve Transformer tabanlı sistemler çok doğru olabilir, fakat genellikle yeraltındaki sert ve dinamik koşullar için çok yavaş veya çok kaynak tüketen çözümler oluyor. Ayrıca standart modeller madenlerdeki özel görsel sorunlara—aşırı kontrast, dönen toz, makinelerin kısmi görünümü ve sürekli değişen arka planlar—özelleştirilmemiş durumda.
Az kaynakla güçlü bir algılama motoru
Bu kısıtlamalarla başa çıkmak için araştırmacılar, gerçek zamanlı bir algılayıcı olan YOLOv8'i temel alıyor ve onu kömür madenciliği için yeniden tasarlayarak YOLOv8-EST'yi oluşturuyorlar. Temel fikir, modeli şişirmeden daha akıllı özellik işleme bileşenleri eklemek. İlk olarak, yerel ayrıntı ve daha uzun menzilli desenleri (örneğin bir konveyör hattının şekli veya bir kırıcı gövdesinin konturu) yakalamaya yardımcı olmak için küçük görüntü pencereleri içinde ve kaydırılmış pencereler arasında dikkat kullanan Swin Transformer blokları ekliyorlar. İkinci olarak, modelin mekansal ilişkileri anlamasını basit doğrusal formüller yerine küçük bir derin ağ ile ürettikleri göreli pozisyon kodlamalarıyla iyileştiriyorlar; bu, örneğin bir püskürtme bulutunun kesme tamburuyla doğru hizalanıp hizalanmadığını ayırt etmeye yardımcı oluyor. Üçüncü olarak, GELUS adını verdikleri değiştirilmiş bir aktivasyon fonksiyonu getiriyorlar; bu fonksiyon maden görüntülerinde yaygın olan gürültülü, düşük kontrastlı sinyallere karşı pürüzsüz ama verimli tepki verecek şekilde matematiksel olarak ayarlanmış, hesaplamayı azaltırken öğrenmeyi kararlı tutuyor. Son olarak, EMA dikkat modülü üstel hareketli ortalama stratejisi kullanarak güncel ve geçmiş özellik bilgisini harmanlıyor; bu da ağın gerçekten önemli bölgelere odaklanmasına ve gürültülü, titrek arka planları bastırmasına yardımcı oluyor.

Sistemi teste koymak
Araştırma ekibi, tam mekanize bir çalışma yüzünden CM veri kümesi adını verdikleri 10.862 görüntüden oluşan özel bir görüntü veri seti derledi. Bu sahnelerde makine gövdesi, kesme tamburu, kazı bandı, bant konveyör ve püskürtme sistemi farklı aydınlatma ve toz koşulları altında yer alıyor. Veriyi eğitim, doğrulama ve test alt kümelerine böldüler ve dayanıklılığı test etmek için görüntüleri düşük ışık/yüksek toz, orta ve normal koşullar olarak grupladılar. Standart kalite ölçüleri—precision (kesinlik), recall (duyarlılık) ve ortalama doğruluk (mAP)—kullanarak YOLOv8-EST'yi YOLOv3-tiny ve SSD-Mobilenetv2 gibi daha hafif modellerle, ana akım YOLOv5 ve YOLOv8 ile, Faster R-CNN ve RetinaNet gibi daha ağır iki aşamalı algılayıcılarla ve DETR ile RT-DETR dahil Transformer tabanlı tasarımlarla karşılaştırdılar. Bu testlerin tamamında YOLOv8-EST en iyi dengeyi sağladı: yaklaşık %98 civarında kesinlik ve duyarlılık ile çok yüksek bir mAP sunarken, modeli tek bir endüstriyel sınıf grafik kartında gerçek zamanlı kullanım için yeterince kompakt tuttu.
Bu maden güvenliği için ne ifade ediyor
Uzman olmayanlar için ana sonuç, bu araştırmanın yeraltından gelen ham, bulanık videoyu kritik madencilik ekipmanları hakkında güvenilir, otomatik durum raporlarına çevirmesi. İşçilerin toz ve hareket bulanıklığıyla dolu loş ekranları sürekli görsel olarak izlemesini istemek yerine, YOLOv8-EST bir konveyör durduğunda, bir tamburun olması gerektiği yerde olmadığında veya bir püskürtme sisteminin devre dışı kaldığında uyarı verebiliyor ve bunu neredeyse insan seviyesinde doğrulukla, günün her saati yapabiliyor. Modern YZ tekniklerini maden yüzünde verimli çalışacak şekilde dikkatle uyarlayarak—sadece uzak veri merkezlerinde değil—sistem, daha güvenli, daha istikrarlı ve daha akıllı kömür üretimine pratik bir yol sunuyor.
Atıf: Wang, H., Wu, G., Yang, Q. et al. Working face status detection in coal mine based on YOLOv8-EST. Sci Rep 16, 7787 (2026). https://doi.org/10.1038/s41598-026-35452-2
Anahtar kelimeler: maden güvenliği, nesne tespiti, bilgisayarlı görü, derin öğrenme, endüstriyel otomasyon