Clear Sky Science · pl

Uczenie głębokie do wykrywania odpadów budowlanych z użyciem uwagi ConvNeXt V2 EMA i funkcji strat WIoU v3

· Powrót do spisu

Dlaczego mądrzejsze sortowanie gruzu ma znaczenie

Każda nowa budowa, remont czy rozbiórka generuje góry gruzu — połamany beton, cegły, dachówki, drewno, piankę i inne materiały. Duża część tych surowców nadaje się do recyklingu, a mimo to często trafia na składowiska, bo sortowanie ręczne jest wolne, kosztowne i podatne na błędy. W badaniu zbadano, jak zaawansowana forma sztucznej inteligencji może automatycznie rozpoznawać i sortować różne typy odpadów budowlanych ze zdjęć, pomagając miastom ograniczać zanieczyszczenie, oszczędzać surowce i przybliżać się do rzeczywistej gospodarki obiegu zamkniętego w sektorze budowlanym.

Grunt, surowce i narastający globalny problem

Odpady z budownictwa i rozbiórek to jeden z najszybciej rosnących strumieni odpadów na świecie — powstaje ich około miliarda ton rocznie. Stosy gruzu zajmują tereny, grożą zanieczyszczeniem gleby i wód oraz marnują materiały, których wytworzenie wymagało energii i generowało emisje. Obecnie ich zagospodarowanie w dużej mierze polega na składowaniu i magazynowaniu. Zautomatyzowane systemy wizyjne, które szybko odróżnią beton od cegły, dachówkę od drewna czy piankę od płyty gipsowo‑kartonowej, mogłyby znacznie zwiększyć poziomy recyklingu. Jednak realne place budowy są chaotyczne: obiekty nachodzą na siebie, pokryte są pyłem i mają podobne kolory oraz faktury, co utrudnia niezawodne rozpoznawanie automatyczne.

Figure 1
Figure 1.

Nowe cyfrowe „oko” do sortowni na taśmie

Autorzy przedstawiają dostosowany system detekcji obiektów nazwany YOLO‑CEW, zbudowany w oparciu o popularną rodzinę modeli YOLO do przetwarzania obrazu w czasie rzeczywistym. Model trenowano na specjalistycznym zestawie 1 774 obrazów wykonanych w zakładzie recyklingu na Cyprze, zawierającym ponad 11 000 oznaczonych fragmentów odpadów budowlanych i rozbiórkowych w sześciu typowych kategoriach: beton, cegła, dachówka, płyta gipsowo‑kartonowa, drewno i pianka. Obrazy podzielono na zbiory treningowe, walidacyjne i testowe, aby uniknąć przeuczenia, a model uruchamiano wielokrotnie z różnymi losowymi startami, by zapewnić odporność wyników. Celem było utrzymanie systemu na tyle szybkiego, by nadawał się do pracy na ruchomych taśmach, przy jednoczesnym znaczącym zwiększeniu dokładności wykrywania i etykietowania każdego fragmentu gruzu.

Jak ulepszona SI widzi więcej i uczy się na błędach

YOLO‑CEW poprawia bazowy model YOLOv8 na trzy kluczowe sposoby. Po pierwsze, w wybranych etapach zastępuje ekstraktor cech nowocześniejszym backbone’em ConvNeXt V2, który lepiej uchwyca subtelne różnice wizualne — na przykład drobne wzory odróżniające dachówki od betonu — bez istotnego spowolnienia systemu. Po drugie, dodaje moduł Efficient Multi‑scale Attention (EMA), który uczy sieć skupiać się na najbardziej informacyjnych obszarach w różnych skalach, poprawiając zdolność wykrywania zarówno dużych płatów, jak i małych, częściowo zasłoniętych fragmentów, a jednocześnie ignorowania rozpraszających elementów tła. Po trzecie, wprowadza zaktualizowaną funkcję straty WIoU v3, która zmniejsza wagę bardzo słabych prognoz ramek ograniczających i koncentruje naukę na bardziej obiecujących przykładach, pomagając modelowi precyzyjniej dopasowywać obwiednie do rzeczywistych obiektów zamiast być zwodzonemu przez zaszumione próbki.

Figure 2
Figure 2.

Testy modelu w realistycznych warunkach

Na zestawie danych odpadów budowlanych YOLO‑CEW osiąga precyzję 96,84%, czułość 95,95% oraz ogólny wynik detekcji (mAP@50) 98,13%, wszędzie przewyższając bazowy YOLOv8. W praktyce oznacza to, że model zarówno rzadziej pomija obiekty, jak i rzadziej zgłasza fałszywe alarmy. Szczególnie dobrze radzi sobie z rozróżnieniem trudnych klas, takich jak dachówki i pianka, choć pewne mylenie cegły z betonem występuje, gdy pył zatarł granice. Co ważne, system nadal działa z prędkością około 128 klatek na sekundę — daleko powyżej wymagań monitoringu w czasie rzeczywistym — więc nadaje się do użycia na czynnych liniach recyklingowych. Testy statystyczne z użyciem procedury bootstrap potwierdzają, że te poprawy nie wynikają z przypadku. Porównania z kilkoma innymi wariantami YOLO pokazują, że YOLO‑CEW konsekwentnie przoduje pod względem dokładności przy zachowaniu korzystnej równowagi między szybkością a wydajnością.

Powyżej jednej sortowni: adaptacja do innych strumieni odpadów

Aby sprawdzić, czy podejście uogólnia się, badacze przetestowali YOLO‑CEW na oddzielnym, publicznym zbiorze do wykrywania odpadów domowych obejmującym powszechne materiały takie jak plastik, szkło i tektura. Nawet bez specjalnego dostosowania do tego środowiska model nadal przewyższa standardowy YOLOv8 w precyzji, czułości i jakości detekcji. Sugeruje to, że udoskonalenia architektoniczne — lepsze wydobywanie cech, inteligentniejsza uwaga i staranniejsze traktowanie słabych przykładów treningowych — mogą być ponownie wykorzystane w innych zadaniach recyklingowych i monitoringu środowiskowego, od sortowania odpadów domowych po wykrywanie śmieci przez drony.

Co to oznacza dla czystszych, mądrzejszych miast

Dla osób niebędących specjalistami wnioski są następujące: YOLO‑CEW działa jak znacznie dokładniejszy i bystrzejszy system wizyjny do rozpoznawania gruzu budowlanego. Może obserwować przesuwający się strumień odpadów, wyłuskiwać każdy obiekt i z dużą niezawodnością oraz szybkością określać, z jakiego jest materiału. Ułatwia to projektowanie zautomatyzowanych linii, gdzie maszyny sortują i kierują materiały do ponownego użycia zamiast na składowiska. Chociaż wyzwania pozostają — jak radzenie sobie z ekstremalnym zaśmieceniem, pyłem i rzadko występującymi materiałami — badanie pokazuje, że starannie dostrojone modele uczenia głębokiego mogą przekształcić dzisiejsze hałdy „odpadów” w jutro strumienie surowców, wspierając bardziej ekologiczne praktyki budowlane i inteligentniejsze miasta.

Cytowanie: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3

Słowa kluczowe: odpady budowlane, recykling AI, wykrywanie obiektów, inteligentne miasta, uczenie głębokie