Clear Sky Science · pl

ResSeMo: integracja głębokich splotowych sieci neuronowych dla wysokodokładnej klasyfikacji odpadów i wydajnego przetwarzania

· Powrót do spisu

Dlaczego inteligentne sortowanie śmieci ma znaczenie

Każdego dnia miasta na całym świecie zmagają się z górami zmieszanych odpadów. Kiedy butelki, puszki, resztki jedzenia i baterie trafiają do tego samego kosza, trudniej i drożej jest je bezpiecznie poddać recyklingowi. W artykule przedstawiono ResSeMo — nowy system widzenia komputerowego, który uczy maszyny szybkiego i niezawodnego rozpoznawania różnych rodzajów odpadów, nawet w realnych ulicznych scenach, co przyczynia się do czystszych dzielnic i bardziej efektywnego recyklingu.

Figure 1. Inteligentny system wzrokowy przekształca zmieszane miejskie śmieci w starannie posegregowane strumienie do recyklingu i bezpieczniejszego przetwarzania.
Figure 1. Inteligentny system wzrokowy przekształca zmieszane miejskie śmieci w starannie posegregowane strumienie do recyklingu i bezpieczniejszego przetwarzania.

Rosnący stos odpadów miejskich

Urbanizacja znacznie zwiększyła ilość odpadów wytwarzanych przez ludzi. Tradycyjne metody sortowania opierają się na pracownikach i prostych maszynach, które często źle klasyfikują ponad jedną czwartą obserwowanych odpadów. Oznacza to, że cenne materiały trafiają na wysypiska lub do spalarni zamiast być ponownie wykorzystane, a niebezpieczne przedmioty, takie jak baterie, przechodzą niezauważone. Badacze zwrócili się ku nowoczesnemu rozpoznawaniu obrazów — kamery i algorytmy analizują zdjęcia śmieci i decydują, czy przedmiot jest ze szkła, plastiku, papieru, metalu czy czymś innym. Jednak wiele istniejących systemów jest albo powolnych i zasobożernych, albo działa dobrze jedynie w czystych, kontrolowanych warunkach laboratoryjnych, a nie na zagraconych chodnikach czy wewnątrz przepełnionych koszy.

Nowy, trzyczęściowy „mózg” do odpadów

ResSeMo rozwiązuje ten problem, łącząc trzy typy modułów sieci neuronowych w jeden skoordynowany „mózg”. Pierwsza część specjalizuje się w wychwytywaniu bogatych detali wizualnych w wielu skalach, takich jak tekstura, kontury i połysk, dzięki czemu potrafi odróżnić szklaną butelkę od plastikowej. Druga część działa jak reflektor, wzmacniając najważniejsze wskazówki wizualne — na przykład ślady korozji na metalu czy wzory typowe dla baterii — jednocześnie osłabiając rozpraszające tło. Ostatni komponent skupia się na osiągnięciu tych efektów przy znacznie mniejszej liczbie obliczeń, umożliwiając systemowi działanie na niewielkich urządzeniach, takich jak inteligentne kosze lub czujniki o niskim poborze mocy, bez dużego zużycia pamięci czy energii. Razem tworzą etapowy proces, który przekształca chaotyczne obrazy w pewne decyzje dotyczące kategorii.

Szkolenie na rzeczywistych odpadach

Aby przetestować ResSeMo, autorzy użyli dwóch głównych zbiorów obrazów. Pierwszy, TrashNet, zawiera kilka tysięcy zdjęć wykonanych w prostych ustawieniach, gdzie każdy obiekt jest wyraźny i wyśrodkowany. Drugi, TACO, jest znacznie większy i bliższy rzeczywistości — pełen śmieci rozrzuconych na ulicach, w parkach i w zakamarkach wnętrz, często maleńkich, częściowo ukrytych lub słabo oświetlonych. Zespół starannie przygotował te dane: zharmonizowano etykiety kategorii między dwoma źródłami, zwiększono liczbę przykładów za pomocą standardowych zabiegów, takich jak rotacje i zmiany jasności, oraz powiększono obszary obrazów wokół bardzo małych przedmiotów, na przykład kapsli, by model mógł je lepiej dostrzec. Dodano także dodatkowe etykiety opisujące, jak brudny i jak masywny jest dany przedmiot, aby wspierać późniejsze analizy, jak wybory sortowania mogą wpływać na cały łańcuch gospodarowania odpadami.

Figure 2. Krok po kroku: jak kompaktowa sztuczna inteligencja filtruje obrazy odpadów, by precyzyjnie rozdzielać różne ich rodzaje.
Figure 2. Krok po kroku: jak kompaktowa sztuczna inteligencja filtruje obrazy odpadów, by precyzyjnie rozdzielać różne ich rodzaje.

Wystawienie modelu na próbę

ResSeMo porównano z dziesięcioma dobrze znanymi sieciami, w tym cięższymi modelami często używanymi w badaniach oraz lżejszymi zaprojektowanymi z myślą o telefonach. Na prostszych zdjęciach z TrashNet nowy system poprawnie sklasyfikował nieco ponad dziewięć na dziesięć obiektów, przy czym wymagał znacznie mniej kroków obliczeniowych niż najpotężniejsi konkurenci. W przypadku trudniejszych obrazów z TACO nadal prawidłowo rozpoznawał niemal 87 procent obiektów, zachowując krótkie czasy przetwarzania. Model dobrze znosił też trudne warunki: gdy badacze dodawali szum, rozmycie, ciemność, olśnienie lub symulowali niesprzyjającą pogodę, dokładność ResSeMo spadała jedynie umiarkowanie i pozostawała wyższa niż u rywali. Dalsze testy na małych płytkach, takich jak NVIDIA Jetson Nano i Raspberry Pi, wykazały, że skompresowana wersja potrafi działać przy niskim zużyciu energii i pamięci, co czyni ją odpowiednią dla urządzeń osadzonych w terenie.

Co to oznacza dla codziennego życia

Mówiąc wprost, ResSeMo pokazuje, że możliwe jest zbudowanie systemu sortowania odpadów, który jest jednocześnie spostrzegawczy i praktyczny. Łącząc zaawansowane rozpoznawanie wzorców z konstrukcją mieszczącą się na niewielkim, energooszczędnym sprzęcie, podejście to pomaga zmniejszyć dystans między badaniami a rzeczywistymi koszami na ulicach. Choć potrzebne są dalsze prace, by radzić sobie z rzadkimi rodzajami odpadów lub ekstremalnymi warunkami, badanie to wskazuje obiecującą ścieżkę dla miast chcących zautomatyzować pierwszą linię sortowania, odzyskać więcej materiałów i trzymać szkodliwe przedmioty z dala od wysypisk i spalarni.

Cytowanie: Liu, T., Li, B. & Wang, Z. ResSeMo: deep convolutional neural network integration for high-accuracy waste classification and efficient processing. Sci Rep 16, 15167 (2026). https://doi.org/10.1038/s41598-026-45814-5

Słowa kluczowe: klasyfikacja odpadów, głębokie uczenie, inteligentny recykling, edge AI, higiena miejska