Clear Sky Science · pl
Głębokie modele resztkowe i hybrydowe CNN do klasyfikacji odpadów w rzeczywistych warunkach z oceną pewności dla zrównoważonego zarządzania odpadami
Dlaczego mądrzejsze sortowanie śmieci ma znaczenie
Współczesne życie generuje góry odpadów, a wiele z nich trafia w niewłaściwe miejsce. Kiedy surowce do recyklingu zostają zakopane na wysypiskach lub resztki jedzenia mieszają się z metalami i tworzywami sztucznymi, tracimy cenne zasoby i tworzymy zanieczyszczenia oraz gazy cieplarniane. W tym badaniu analizujemy, jak zaawansowana sztuczna inteligencja oparta na obrazach może automatycznie rozpoznawać różne rodzaje odpadów w chaotycznych warunkach rzeczywistego wysypiska, z celem przyspieszenia, zwiększenia bezpieczeństwa i znacznego podniesienia niezawodności sortowania w porównaniu z pracą ręczną.

Z prawdziwych wysypisk, nie z czystych zdjęć laboratoryjnych
Większość wcześniejszych badań nad automatycznym sortowaniem odpadów opierała się na czystych, starannie przygotowanych zdjęciach: pojedyncza butelka na jednolitym tle albo schludnie ułożone stosy papieru i szkła. W przeciwieństwie do tego autorzy korzystają z zestawu RealWaste — kolekcji tysięcy kolorowych zdjęć wykonanych w rzeczywistym zakładzie przetwarzania odpadów i recyklingu w Australii. Każde zdjęcie może zawierać zdeformowane, nachodzące na siebie lub zabrudzone przedmioty leżące na szorstkim betonie: tekturowe rurki, resztki jedzenia, stłuczone szkło, pognieciony papier, kawałki metalu, plastikowe pojemniki i fragmenty tekstyliów. Obrazy są pogrupowane w dziewięć szerokich kategorii odpowiadających temu, jak zakłady faktycznie sortują odpady na pierwszym etapie, na przykład papier, plastik, metal, odpady organiczne i roślinność. Skupienie się na autentycznych scenach sprawia, że opracowany system jest znacznie bardziej użyteczny w praktyce.
Oczyszczanie obrazu przed podjęciem decyzji
Ponieważ surowe zdjęcia są bardzo zagracone, zespół najpierw „oczyszcza” je przy użyciu kombinacji technik segmentacji obrazu. Zamiast polegać na jednej metodzie, stosują cztery różne sposoby oddzielania obiektów pierwszego planu od tła, z których każda jest dostrojona do wykrywania różnych wskazówek wizualnych, takich jak kontrast, oświetlenie czy grupowanie kolorów. Wyniki są łączone tak, by zachować tylko obszary zaakceptowane przez kilka metod jako prawdopodobne fragmenty odpadów. Kolejny krok rozdziela obiekty, które dotykają się lub są ułożone jeden na drugim. W efekcie powstaje udoskonalona maska, która podkreśla jedynie śmieci, tłumiąc mylące tekstury podłogi i otoczenia. Oryginalne zdjęcie jest następnie przefiltrowane przez tę maskę, dzięki czemu sieci neuronowe widzą przede wszystkim sam odpad, a nie szumy wokół niego.
Głębokie sieci i modele hybrydowe uczą się rozpoznawać śmieci
Na bazie tego wstępnego przetwarzania badacze dopracowują szeroką gamę nowoczesnych sieci rozpoznawania obrazów, znanych jako splotowe sieci neuronowe. Należą do nich popularne architektury takie jak Inception, DenseNet, VGG, EfficientNet, MobileNet oraz kilka wersji ResNet. Spośród nich wyróżnia się bardzo głęboki model ResNet101, osiągający niemal 99% dokładności i równie wysoką wartość F1 na danych RealWaste. Aby pójść dalej, autorzy budują modele „hybrydowe”, które łączą wewnętrzne mapy cech z dwóch różnych sieci — na przykład wykorzystując zdolność ResNet101 do rozpoznawania tekstury i struktury razem z możliwością InceptionV3 obserwowania obiektów w różnych skalach. Te hybrydy okazują się szczególnie pomocne w trudnych kategoriach, takich jak tekstylia i różne odpady, gdzie przedmioty mogą być pomięte, porwane lub częściowo ukryte.
Sprawdzanie nie tylko, co model przewiduje, ale jak jest tego pewny
Ponad surową dokładność, badanie zadaje kluczowe pytanie dla systemów mających pracować w zakładach przemysłowych lub miejskich centrach sortowania: jak bardzo model jest pewny każdej decyzji? Dla każdego przewidywania sieć generuje wartość pewności między 0 a 1, wskazując, jak silnie wierzy, że dany element należy do konkretnej klasy. Autorzy analizują rozkład tych wyników na tysiącach obrazów testowych. Stwierdzają, że dla wyraźnie odmiennych kategorii, takich jak roślinność, plastikowe pojemniki czy odpady organiczne, zarówno najlepszy pojedynczy model, jak i najlepszy model hybrydowy zwykle przewidują z bardzo wysoką pewnością, często powyżej 0,95. Bardziej mylące kategorie wykazują szersze spektrum wyników, wskazując miejsca, gdzie potrzebna jest dodatkowa kontrola ludzka lub lepsze dane treningowe. Pokazują też, że dodanie kroku segmentacji przed klasyfikacją mierzalnie podnosi wszystkie kluczowe miary wydajności, od dokładności po F1.

W kierunku bardziej niezawodnych i zrównoważonych systemów gospodarowania odpadami
Mówiąc prosto, artykuł pokazuje, że starannie zaprojektowane połączenie oczyszczania obrazu, głębokiego uczenia i projektowania modeli hybrydowych może rozpoznawać rzeczywiste odpady z godną uwagi niezawodnością, nawet gdy przedmioty są zabrudzone, nachodzą na siebie lub mają nietypowe kształty. ResNet101 wyrasta na potężne jądro, podczas gdy modele hybrydowe dają dodatkową przewagę dla najtrudniejszych do wykrycia materiałów. Przypisując każdej decyzji sensowną wartość pewności, system nie tylko sortuje odpady, lecz również sygnalizuje, kiedy może być niepewny, torując drogę do bezpieczniejszej automatyzacji. Choć potrzebne są dalsze prace nad zmniejszeniem modeli dla małych urządzeń i przetestowaniem ich w pełnoskalowych, działających w czasie rzeczywistym zakładach, badania te kładą solidne fundamenty pod inteligentne sortowanie odpadów, które może pomóc miastom zwiększyć poziom recyklingu, wysyłać mniej na wysypiska i zmniejszać ekologiczny ciężar codziennych śmieci.
Cytowanie: Kumar, Y., Bhardwaj, P., Malhotra, S. et al. Deep residual and hybrid CNN models for confidence-aware real-world waste classification for sustainable waste management. Sci Rep 16, 10424 (2026). https://doi.org/10.1038/s41598-026-41001-8
Słowa kluczowe: klasyfikacja odpadów, głębokie uczenie, wizja komputerowa, systemy recyklingu, zrównoważone zarządzanie odpadami