Clear Sky Science · tr
Görünür, Kızılötesi, Yakın Kızılötesi ve Terahertz Görüntüleme Kullanarak Hacimli Atıkların Segmentasyonu için Çokmodlu ve Hiperspektral Veri Seti
Daha akıllı atık ayrıştırmanın önemi
Kırık gardıroplardan çökmüş koltuklara kadar evsel hacimli eşyalar sıklıkla geri dönüştürülebilecek ölçüde değerli ahşap içerir. Yine de, bu malzemelerin çoğu makinelerin ahşabı plastikten, metallerden ve dolgulardan ayırt etmede zorlanması; özellikle malzemeler üst üste yığıldığında veya birbirinin içinde saklandığında yakılmakta ya da çöplüğe gitmektedir. Bu makale, yapay zekânın bu karışık yığınların içini daha iyi “görmesine” yardımcı olmak üzere tasarlanmış ayrıntılı bir görüntü veri seti olan WoodVIT’i tanıtıyor; amaç, gelecekteki ayrıştırma sistemlerinin daha fazla ahşabı güvenli ve verimli şekilde geri kazanabilmesini sağlamaktır.

Çöpü yeni tür gözlerle görmek
Geleneksel geri dönüşüm makineleri genellikle bizim gözlerimizin gördüğüne yakın görüntü sağlayan kameralara dayanır. Bu, temiz tekil nesneler için iyi çalışırken, hacimli atıklar karmaşıktır: ahşap boyalı olabilir, kumaşla kaplı olabilir, plastikle sarılabilir veya metal ile güçlendirilmiş olabilir. Yazarlar bunu aynı atık parçalarının dört farklı “görünümü”nü birleştirerek ele alıyorlar. Görünür ışık kamerası (sıradan renkli görüntüler), malzemeye özgü spektral parmak izlerini yakalayan yakın kızılötesi kamera, nesnelerin ısınma ve soğuma davranışını izleyen termal kamera ve yüzeyin altındaki yapıları algılayabilen terahertz sensörü kullanıyorlar. Her teknoloji farklı fiziksel özellikleri yakalar ve birlikte tek bir sensörün sağlayacağından daha eksiksiz bir görüntü sunarlar.
Kırık mobilyalardan makineler için verilere
Veri setini oluşturmak için ekip, yerel bir atık tesisinden ezilmiş mobilya ve diğer hacimli atık parçalarını topladı. Bu karışık parçaları, dört sensörün altından geçen ve endüstriyel bir ayırma hattını taklit eden standart panolara yerleştirdiler. Her pano her sensör tarafından bir kez görüntülendi, ardından her bir görüntüdeki her pikselin diğer görüntülerde aynı fiziksel noktaya karşılık gelmesi için dört görüntü dikkatle hizalandı. İnsan anotatörler renkli görüntüler üzerinde ahşap, metal, plastik, mineraller, döşeme ve metalin ahap altında ya da ahşabın kumaş altında saklı olduğu gibi birkaç “örtülü” durumu işaretleyerek ayrıntılı sınırlar çizdiler. Bu etiketler diğer sensör görünümlerine aktarıldı ve 56 tam hizalanmış sahne ile makine öğrenmesi modellerinin eğitimi ve testi için hazır 22.659 küçük görüntü parçası üretildi.

Bilgisayarlara ahşabı ve gizli tehlikeleri öğretmek
WoodVIT’in temel görevi basitçe ifade edilebilir: bir görüntü parçasının “ahşap” mı yoksa “ahşap olmayan” mı olduğunu belirlemek. İşin perde arkasında, bu her parça için dört sensör genelinde 717 kanal bilgiyle uğraşmayı içeriyor. Yazarlar bu görevde birkaç sinir ağı modelini test etti; bazılarını tek sensörlü, bazılarını ise tüm sensörlerin birleşimiyle eğittiler. Sadece renkli görüntülerle eğitilen modeller makul performans gösterdi, ancak dört sensörden gelen bilgileri birleştiren modeller daha iyi ve daha istikrarlı sonuç verdi. Termal ve terahertz verileri tek başına öğrenmesi daha zor olsa da, renk ve yakın kızılötesi görünümlerle birleştirildiklerinde özellikle ahşabın kaplandığı, üst üste konduğu veya metal parçaları sakladığı zor sahnelerde değerli hale geldiler.
Örtü ve karmaşık sahneleri anlamak
WoodVIT’in ayırt edici özelliği gerçekçi, “ideal olmayan” durumlara odaklanmasıdır. Veri seti, metal vidaların ahşabın içinde gömülü olduğu veya ahşap çerçevelerin köpük veya kumaşla sarıldığı panoları içerir. Bu örtülü vakalar için araştırmacılar temel gerçeği iki adımda oluşturdu: önce taban katmanı görüntüleyip etiketlediler, sonra örtüyü ekleyip yeniden görüntülediler ve etiketleri birleştirdiler. Bu dikkatli tasarım, farklı sensör kombinasyonlarının yüzeyin altındakini ne kadar ortaya koyduğunu değerlendirmeyi mümkün kılıyor. Yazarlar ayrıca her parçadaki ahşap bölgelerinin sınırlarını veren popüler bir sinir ağı tasarımını kullanarak piksel düzeyinde segmentasyonu da incelediler. Hem renk hem de yakın kızılötesi girdiler doğru sınırlar üretti; bu da verilerin yalnızca evet/hayır kararlarını değil, aynı zamanda ahşabın tam olarak nerede olduğunu gösteren ayrıntılı haritaları da desteklediğini gösteriyor.
Geleceğin geri dönüşümü için anlamı
Uzman olmayanlar için ana mesaj, daha akıllı geri dönüşümün yalnızca daha iyi bir kamera inşa etmekle ilgili olmadığı — birçok görme biçimini tek, tutarlı bir bakışta birleştirmekle ilgili olduğudur. WoodVIT bunun ham materyalini sunuyor: görünür, kızılötesi ve terahertz bantlarında gerçek hacimli atığın nasıl göründüğünü yakalayan, kamuya açık ve özenle etiketlenmiş bir görüntü koleksiyonu. Araştırmacıların aynı zorlu, çokmodlu veri üzerinde gelişmiş algoritmaları eğitmesine ve karşılaştırmasına olanak tanıyarak, bu çalışma daha kullanılabilir ahşabı geri kazanabilen, gizli metal kontaminantları tespit edebilen ve nihayetinde hacimli atık geri dönüşümünü daha temiz, daha güvenli ve daha verimli hale getirebilecek yeni nesil ayırma sistemlerinin temelini atıyor.
Atıf: Bihler, M., Roming, L., Čibiraitė-Lukenskienė, D. et al. Multimodal and Hyperspectral Dataset for Segmentation of Bulky Waste using VIS, IR, NIR, and Terahertz Imaging. Sci Data 13, 498 (2026). https://doi.org/10.1038/s41597-026-07053-1
Anahtar kelimeler: hacimli atık geri dönüşümü, çokmodlu görüntüleme, hiperspektral veri, ahşap ayırma, sensör füzyonu