Clear Sky Science · tr
İnşaat ve yıkım atıkları için kademeli grup dikkat mekanizmasına dayalı bir nesne algılama algoritması
Daha Akıllı Atık Ayrıştırmanın Neden Önemli Olduğu
Her bina inşa edildiğinde veya yıkıldığında büyük miktarda moloz oluşur—beton parçaları, kırık tuğlalar, fayanslar, ahşap, metal ve plastik. Bu inşaat ve yıkım atıkları artık birçok şehirde çöplerin yaklaşık %40’ını oluşturuyor. Bu molozların içinde yeni yapı ürünlerine geri dönüştürülebilecek değerli malzemeler gizli, ancak bugün ayrıştırmanın büyük kısmı hâlâ elle yapılıyor; bu yavaş, maliyetli ve tehlikeli. Bu makale, parçalar küçük, üst üste binmiş veya birbirine çok benziyor olsa bile farklı inşaat atığı türlerini gerçek zamanlı olarak otomatik tespit ve sınıflandırabilen yeni bir bilgisayar görüsü sistemi sunuyor.

Bir Moloz Yığınının İçindeki Düzeni Görmenin Zorluğu
Karışık inşaat döküntülerini ayırmak makineler için beklenmedik şekilde zor. Örneğin beton ve seramik fayans parçaları genellikle benzer renk ve dokulara sahip olduğundan kolayca karışabiliyor. Gerçek dünya sahnelerinde büyük parçalar küçük parçacıkların yanında duruyor, birçok nesne kısmen gizlenmiş oluyor ve aydınlatma veya kamera açısı malzemelerin görünümünü değiştirebiliyor. Bu görev için geliştirilen önceki yapay zeka sistemleri ya yeterince doğru değildi, çok küçük nesnelerle başa çıkmakta zorlanıyordu ya da ayrıştırma hatları ve mobil ekipman için gerçekçi olmayan yüksek hesaplama gücü gerektiriyordu. Yazarlar, bu dağınık, karmaşık sahnelerle daha iyi başa çıkmak için popüler ve hızlı bir nesne algılama ailesi olan YOLO modellerini iyileştirmeye odaklanıyorlar ve bunu yavaşlatmadan yapmayı hedefliyorlar.
Ağın Dikkatini Çekmenin Yeni Bir Yolu
Yeni yöntemin özü, dil ve görmede kullanılan transformer modellerinden esinlenen, görüntüleri aşamalı olarak işleyen yeniden tasarlanmış bir "omurga"dır. Görüntüyü yalnızca küçük yerel yamalar olarak ele almak yerine ağ, uzaktaki bölgelerin birbirleriyle nasıl ilişkili olduğunu öğrenir; bu, nesneler üst üste bindiğinde veya arka plana karıştığında yardımcı olur. Bunu verimli yapmak için yazarlar kademeli grup dikkat mekanizmasını tanıtıyor. Görüntünün iç temsilini gruplara ayırıyorlar, her grubun kendi içinde desenlere odaklanmasına izin veriyorlar ve sonra bilgiyi bir gruptan diğerine kademeli olarak aktarıyorlar. Bu "önce yerel odak, sonra küresel rafine" düzeni, örneğin beton ile seramik arasındaki ince farkları vurgulamayı sağlarken bellek ve hesaplama yükünü gerçek zamanlı kullanım için yeterince düşük tutuyor.
Atıklara Aynı Anda Birkaç Ölçekte Bakmak
Malzeme türlerini tanımanın ötesinde sistem ayrıca çok farklı boyutlardaki nesneleri, küçük kırık parçacıklardan büyük kirişlere kadar, bulmak zorunda. Bu nedenle model her biri farklı görüntü çözünürlüğünde çalışan birden çok katman kullanıyor. Özel bir etkileşim modülü, bilgilerin kaba, genel katmanlardan ince, ayrıntılı katmanlara ve geri akışına izin veriyor. Kaba katmanlar genel bağlamı sağlar—yığınların nerede olduğu, nesnelerin nasıl kümelendiği—ise ince katmanlar keskin kenarlar ve dokuları sunar. Bir mekânsal dikkat bileşeni ardından her ölçekte en bilgi verici bölgeleri vurgulayıp dikkat dağıtan arka planı bastırıyor. Son olarak, her çözünürlükte ayrı tespit dalları nesnelerin nerede olduğunu ve hangi malzemeye ait olduğunu tahmin ediyor; eğitim düzeni ise kesin kutu yerleşimini teşvik ederken çok sayıda nesne bulma ile yalancı alarmlardan kaçınma arasındaki dengeleri gözetiyor.

Sistemi Teste Sokmak
Yaklaşımlarını değerlendirmek için araştırmacılar iki kamu inşaat ve yıkım atığı veri kümesini kullandılar. BTC adlı veri kümesi tuğla, fayans ve betondan oluşan görüntüler içerirken; SWP çelik, ahşap ve plastiklere odaklanıyor ve binlerce yüksek çözünürlüklü görüntü içeriyor. Ekip yöntemlerini bu görev için uyarlanmış çeşitli mevcut YOLO sürümleriyle karşılaştırdı. Sistemleri her iki veri kümesinde de belirgin şekilde daha yüksek tespit puanları elde etti; özellikle tahmin edilen kutuların gerçek nesne sınırlarıyla ne kadar hassas hizalandığını ölçen daha zor kriterde başarı gösterdi. Çok yüksek hatırlama oranını korumada—neredeyse hiç nesne kaçırmama—özellikle güçlüydü ve toplam hesaplama yükünü makul düzeyde tutarak birçok rakip modelle rekabet edebilir veya onlardan daha düşük performans sergiledi.
Gerçek Dünya Geri Dönüşümü İçin Anlamı
Uzman olmayanlar için temel çıkarım, yazarların inşaat döküntülerini ayırmak için önceki araçlardan daha iyi çalışan daha akıllı bir "göz" geliştirdikleridir; bu göz meşgul, kaotik sahnelerde geri dönüştürülebilir malzemeleri ayırt edip seçebiliyor. Verimli dikkat mekanizmalarını çok ölçekli işlemle birleştirerek sistem küçük ve üst üste binmiş parçaları daha doğru tespit ediyor ve hâlâ endüstriyel donanımda pratik olacak kadar hızlı çalışıyor. Atık ile arka plan arasındaki bazı karışıklıklar devam etse de genel performans farklı veri kümeleri arasında güçlü ve istikrarlı. Uzun vadede bu tür gelişmeler, geri dönüşüm tesislerinin daha az elle çalışma ile daha fazla değerli malzeme kurtarmasına, çöplük kullanımının azalmasına ve inşaat sektörünün daha temiz ve kaynak açısından verimli hale gelmesine yardımcı olabilir.
Atıf: Jiang, Z., Yang, Y., Hu, J. et al. A cascaded group attention mechanism-based object detection algorithm for construction and demolition waste. Sci Rep 16, 11798 (2026). https://doi.org/10.1038/s41598-026-41557-5
Anahtar kelimeler: inşaat atığı tespiti, derin öğrenme görseli, otomatik geri dönüştürme, nesne algılama, dikkat mekanizmaları