Clear Sky Science · tr
AE-LFOG-YOLO: uyarlanabilir ankrajlar ve aydınlatmaya dayanıklı öğrenme ile sağlam iş güvenliği baret tespiti
Akıllı baret kontrollerinin önemi
Büyük inşaat projelerinde ve yeraltı tünellerinde basit bir iş güvenliği baretinin varlığı, kazadan dönen bir olay ile hayatı değiştiren bir yaralanma arasındaki fark olabilir. Ancak gerçek iş sahalarının karmaşasında insanlar baret takmayı unutabilir veya ihmal edebilir ve insan denetçiler her köşeyi her zaman izleyemez. Bu çalışma, tünel loş olsa da, lambalardan gelen parlama ile dolu olsa da veya kameraya farklı mesafelerde çok sayıda işçi dolu olsa bile kimin baret takıp takmadığını güvenilir şekilde tespit eden otomatik bir kamera sistemi nasıl kurulur sorusunu araştırıyor.
Zorlu tünel aydınlatmasında görmenin zorlukları
Tünel inşaat sahaları görsel olarak uç ortamlardır. Parlak spot ışıklar parlama yaratırken, derin gölgeler ayrıntıları gizler. İnsanlar kameraya doğru ve kameradan uzaklaşarak hareket ettiğinden, baretlerin görünür boyutları çok farklı olabilir. Standart yapay zekâ algılayıcıları bu koşullarda sıklıkla başarısız olur: karanlık bölgelerde bareti kaçırır, diğer yuvarlak nesneleri baretle karıştırır veya çok küçük ya da uzaktaki işçilerle zorlanır. Mevcut pek çok sistem bunu görüntüleri tespit öncesinde parlatarak veya temizleyerek ya da popüler YOLO nesne algılama modellerinin bazı bileşenlerini değiştirerek düzeltmeye çalışır. Ancak bu adımlar genellikle ayrı takviyeler olduğu için tek bir öğrenme sürecinin parçası haline gelmez; bu da performanstan ödün verir ve aydınlatma veya sahne düzeni değiştiğinde sağlamlık kaybına yol açar.

Kameralara kötü aydınlatmayı görmezden gelmeyi öğretmenin yeni yolu
Yazarlar, yaygın olarak kullanılan YOLOv8 algılayıcısı üzerine kurulu AE‑LFOG‑YOLO adında geliştirilmiş bir sistem öneriyor. İlk temel fikir, Aydınlatmaya Dayanıklı Modül (Illumination‑Invariant Module): ağın içine eklenen küçük birim, “ışığın ne yaptığı” ile “nesnelerin gerçekte nasıl göründüğü”nü birbirinden ayırmayı öğrenir. Gelen özellikle haritalarını (feature maps) esas olarak aydınlatma desenlerini yansıtan bir kısma ve kaskın kavisli kenarı gibi daha kararlı şekil ve dokuyu yakalayan bir kısma böler. Özel kapama (gating) işlemleri ve kenar ile köşelere odaklanan bir dal kullanan modül, parlaklıktaki dalgalanmaları etkisizleştirir ve kararlı geometrileri vurgular. Bu, ayrı bir ön işlem adımı yerine algılayıcının içinde gerçekleştiği için tüm sistem uçtan uca eğitilebilir; böylece model, parlama veya karanlık yamalar tarafından aldatılmak yerine doğrudan baretlere odaklanmayı öğrenir.
Modelin kendi görme alışkanlıklarını geliştirmesine izin vermek
İkinci ana fikir, algılayıcının nesnelerin nerede görünebileceğini nasıl tahmin ettiğine odaklanır. Pek çok algılayıcı, muhtemel nesne boyut ve şekillerini öneren sabit bir “ankraj kutuları” (anchor boxes) kümesiyle başlar; bunlar genellikle eğitim verisinden bir kez seçilir ve güncellenmez. Oysa tünellerde baretin görünür boyutu kamera mesafesi ve bakış açısıyla dramatik biçimde değişebilir. AE‑LFOG‑YOLO, statik ankrajları Adaptive Evolutionary – Light Field Optimized Generation adını taşıyan dinamik bir süreçle değiştirir. Her eğitim turunun sonunda sistem ankraj kutularını hafifçe pertürbasyon yapar, bunların gerçek baretlerin tüm boyutlarına ne kadar iyi uyduğunu puanlar ve ayrıca boyutlarının temel kamera optiğine göre mantıklı olup olmadığını—tipik çalışma mesafelerinde gerçek bir baretin sensörde ne kadar büyük görünmesi gerektiğini—kontrol eder. Daha iyi puan alan ankraj setleri bir sonraki tura kalır. Zaman içinde algılayıcı, hem veriye uyan hem de kameraların dünyayı nasıl görüntülediğini göz önünde bulunduran ankrajlar “evrimleştirir”.

Eğitimi gerçek dünya görüntü kalitesine uyarlamak
Modelin ne aradığını değiştirmekle kalmayıp yazarlar öğrenme biçimini de değiştirir. Görüntü kalitesi kötü olduğunda baretlerin konumunu hassas şekilde belirlemeye, koşullar iyi olduğunda ise baret/no‑baret etiketlemesini doğru yapmaya daha fazla önem veren bir eğitim stratejisi getirirler. Kamera görüntüleme ilkelerinden türetilen fizik tabanlı bir puan, sistemin her aşamada görüntülerin ne kadar güvenilir olduğunu söyler. Aydınlatma veya odak kötü ise eğitim süreci otomatik olarak kutu (bounding box) doğruluğunun önemini artırır; koşullar iyileşirse ağırlığı sınıflandırmaya kaydırır. Bu, modelin karşılaşacağı fiziksel çevreye uyum sağlamak için önceliklerini sürekli olarak ayarladığı bir geri besleme döngüsü oluşturur.
Pratik testlerin gösterdikleri
Araştırmacılar yaklaşımını gerçek bir tünel güvenlik‑baret veri kümesinde test eder ve bunu çeşitli gelişmiş YOLO‑tabanlı yöntemlerle karşılaştırır. AE‑LFOG‑YOLO, standart örtüşme eşik değerinde yaklaşık yüzde 95 oranında doğru baret tanımlayarak çok yüksek doğrulukla baretleri tespit eder ve düz YOLOv8 temel modelini hem hassasiyet hem de duyarlılık (precision ve recall) açısından geride bırakır. Gerçek zamanlı kullanım için yeterince hızlı çalışır ve özellikle aydınlatma ağır şekilde karanlığa veya aşırı pozlamaya manipüle edildiğinde güçlü performans gösterir. Bu zorlu koşullar altında yeni modelin güveni daha yüksek kalır, daha fazla küçük ve uzak işçiyi tespit eder ve parlaklık aralığı bakımından temel modele göre yüzde 33’ten fazla daha geniş bir aralıkta güvenilirliğini sürdürür; bu da daha geniş bir gerçek dünya sahne setinde güvenilir olduğu anlamına gelir.
Bu işçilerin daha güvende kalmasına nasıl yardımcı olur
Uzman olmayanlar için çıkarım nettir: bu çalışma, bir yapay zekâ sistemine yalnızca pikselleri değil aynı zamanda kameraların zorlu ortamlarda nasıl gördüğünün fiziğini de öğretmenin, tünel duvarındaki daha akıllı ve daha güvenilir bir gözetleyici sunduğunu gösteriyor. AE‑LFOG‑YOLO yanıltıcı aydınlatmayı daha iyi görmezden gelebilir ve değişen görüş açılarına uyum sağlayabilir; böylece kaçırılan tespitleri ve yanlış alarmları azaltır. İşleyen bir ray‑taşımacılık hattında aylardır konuşlandırıldığında, işçilerin baret takmasını sağlama konusunda güvenlik ekiplerine destek olabileceğini kanıtladı ve daha güvenli, daha yakından izlenen inşaat sahalarına yönelik pratik bir adım sunuyor.
Atıf: Liu, S., Wang, J. AE-LFOG-YOLO: robust safety helmet detection via adaptive anchors and illumination invariant learning. Sci Rep 16, 6402 (2026). https://doi.org/10.1038/s41598-026-37326-z
Anahtar kelimeler: iş güvenliği baret tespiti, tünel inşaatı, bilgisayarlı görme, az ışıkta görüntüleme, YOLOv8