Clear Sky Science · tr
Farklı kromatik alanlardan yararlanan YOLO mimarileri kullanılarak gerçek zamanlı endüstriyel güvenlik otomasyonu
Fabrikada Daha Akıllı Gözetleme
Metal kaynaklardaki gizli kusurlar, sağlam makineleri, köprüleri veya boru hatlarını sessi̇z tehlikelere dönüştürebilir. Geleneksel olarak, eğitimli denetçiler metal dikişlerinin parlak bölgelerine bakarak küçük çatlakları veya boşlukları kazadan önce tespit etmeye çalışır. Bu makale, yapay zekânın bu gözetleme işinin büyük bir kısmını üstlenebileceğini, hızlı görüntü tanıma yazılımlarıyla kaynakları gerçek zamanlı olarak inceleyebileceğini; parçalar bant üzerinde ilerlerken bile değerlendirme yapabileceğini araştırıyor. Araştırmacılar, popüler bir yapay zekâ algılayıcısı olan YOLO’nun birkaç sürümünü karşılaştırıp rengin farklı temsil biçimlerinin görüşünü nasıl etkilediğini test ederek daha güvenli ve verimli fabrikalara doğru bir yol gösteriyorlar.

Kötü Kaynakları Tespit Etmeyi Zorlaştıran Nedir?
Yoğun bir üretim hattında kaynakların şekli, parlaklığı ve arka plan karmaşası değişkenlik gösterir. Tek bir görüntüde birden fazla kaynak ve kusur bulunabilir; bu da basit bir görüntü sınıflandırmasını (genel olarak "iyi" veya "kötü") aşırı kaba hale getirir. Bunun yerine sistem hem dikişteki belirli problem bölgelerini bulmalı hem de etiketlemelidir. Yazarlar, her birinin farklı bir müdahale gerektirdiği kabul edilmesi, derhal yeniden işleme veya parçayı kabul etme gibi yanıtlar olması nedeniyle üç pratik kategoriye odaklanıyor—iyi kaynak, kötü kaynak ve açık kusur. Yapay zekânın gerçekçi yüzeyler, aydınlatma koşulları ve kusur türleri aralığında eğitilip test edilmesini sağlamak için 6000’den fazla açıklamalı kaynak görüntüsünden oluşan halka açık bir veri seti kullanıyorlar.
Makinelere Bir Kez Bakıp Karar Vermeyi Öğretmek
Çalışma, görüntüyü tek geçişte tarayıp bulduklarının etrafına kutular çizen YOLO ("You Only Look Once") nesne algılama modelleri ailesi üzerine odaklanıyor. Araştırmacılar üç nesli karşılaştırıyor: YOLOv3, YOLOv5 ve en yeni YOLOv8. Her sürüm, daha derin ağlar ve daha akıllı eğitim stratejileri sayesinde hız ve doğruluk konusunda gelişmeler sunuyor. Gerçek fabrikalardaki aydınlatma zorluklarını daha iyi taklit etmek için ekip, her kaynak görüntüsünü dört farklı renk uzayına—RGB (tanıdık kırmızı–yeşil–mavi), HSV, LAB ve YCbCr—dönüştürüyor ve her birinde ayrı modeller eğitiyor. Bu çokspektral yaklaşım, renk kodlamasını değiştirmeye bağlı olarak yapay zekânın kusurları daha net görüp göremeyeceği sorusunu sormalarına olanak tanıyor.
Renk, Hız ve Doğruluk Uygulamada
Tüm deneyler boyunca bir desen net: en yeni model YOLOv8, seleflerini geride bırakıyor. Standart RGB görüntüler üzerinde eğitildiğinde YOLOv8, 0.5 eşik değerinde normalize edilmiş ortalama doğruluk (mAP@0.5) olarak 0.592 elde ediyor; bu, aynı koşullarda YOLOv3 ve YOLOv5’ten belirgin şekilde daha yüksek. Pratik anlamda bu, kaynak bölgelerini hem bulma hem de doğru şekilde etiketleme konusunda daha iyi olduğu demek. Model ayrıca son derece hızlı; modern bir grafik kartında saniyede yaklaşık 138 görüntü işliyor—bu, genellikle gerçek zamanlı ölçüt olarak kabul edilen 30 kare/saniyenin çok üzerinde. Renk uzayları arasında RGB, üç YOLO sürümü için de tutarlı şekilde en güçlü sonuçları veriyor; HSV, LAB ve YCbCr geride kalıyor. Bu alternatif kodlamalar belirli görsel özellikleri öne çıkarabilse de, bu ortamda RGB’nin sadeliği ve bilgi içeriğinin yerini alamıyorlar.
Laboratuvar Testlerinden Fabrika Kenarına
Gerçek dünya uygulanabilirliğini göstermek için yazarlar, bant ve kameraya bağlı Raspberry Pi tabanlı bir kenar cihazına sadeleştirilmiş bir YOLOv8 modeli konuşlandırıyor. Kaynaklı parçalar mercek altından geçerken sistem kareleri yakalıyor, temel ön işlemelerle temizliyor ve tespiti yerel olarak çalıştırarak her kaynağı iyi, kötü veya kusurlu olarak sınıflandırıyor. Sonuçlar bir veritabanına kaydediliyor ve denetçiler için canlı kusur işaretlerini ve uzun vadeli kalite eğilimlerini gösteren bir pano üzerinde görüntüleniyor. Ayrıca çerçeve, kaynak hızında veya voltajda yapılabilecek ayarlar önermek ya da yineleyen kusurlar temelinde ekipman bakım zamanını işaretlemek gibi öneriler de üretebiliyor.

Bu, Daha Güvenli Üretim İçin Ne Anlam Taşıyor?
Bir okur için kilit sonuç basit: bu çalışma, hafif ve modern bir yapay zekâ modelinin, özellikle sıradan RGB kamera görüntülerini kullandığında, gerçek endüstriyel koşullarda riskli kaynakları güvenilir ve çok hızlı biçimde işaretleyebileceğini gösteriyor. YOLOv8, açıkça kötü kaynakları ayırt edebilecek kadar doğru ve yüksek hızlı üretim hatlarına yetişebilecek kadar hızlı olduğunu kanıtlıyor; üstelik makinelerin yakınına, mütevazı donanımlarda çalıştırılabiliyor. Yazarlar, bu tür otomatik, renk farkındalıklı muayenenin insan hatasını azaltabileceğini, sorunları daha erken yakalayabileceğini ve daha güvenli, daha tutarlı üretimi destekleyebileceğini savunuyor. Daha zengin eğitim verileri ve daha ince kusur türlerinin işlenmesinin geliştirilmesi gibi gelecekteki iyileştirmeler, bu dijital denetçileri endüstriyel güvenliğin günlük bir parçası haline getirebilir.
Atıf: Pati, N., Sharma, A., Gourisaria, M.K. et al. A real-time industrial safety automation using YOLO architectures leveraging diverse chromatic domains. Sci Rep 16, 7253 (2026). https://doi.org/10.1038/s41598-026-37869-1
Anahtar kelimeler: kaynak kusuru tespiti, endüstriyel güvenlik otomasyonu, YOLOv8, gerçek zamanlı bilgisayarlı görü, edge AI