Clear Sky Science · ru
Глубокие остаточные и гибридные CNN-модели для классификации отходов в реальных условиях с оценкой уверенности для устойчивого управления отходами
Почему важна более умная сортировка мусора
Современная жизнь производит горы отбросов, и значительная часть оказывается не там, где должна. Когда перерабатываемые материалы закапываются на свалках или органические отходы смешиваются с металлом и пластиком, мы теряем ценные ресурсы и создаём загрязнение и парниковые газы. В этом исследовании изучается, как продвинутые системы распознавания изображений на основе искусственного интеллекта могут автоматически распознавать разные виды мусора в беспорядочных условиях реальной свалки, с целью сделать переработку быстрее, безопаснее и значительно надёжнее, чем только ручная сортировка.

Из реальных свалок, а не из чистых лабораторных снимков
Большая часть предыдущих исследований по автоматической сортировке отходов опиралась на чистые, аккуратно подготовленные фото: одна бутылка в центре на нейтральном фоне или аккуратно разложенные стопки бумаги и стекла. В отличие от этого авторы работают с набором данных RealWaste — коллекцией тысяч цветных снимков, сделанных на реальном пункте приёма и переработки отходов в Австралии. На каждом изображении могут присутствовать искажённые, наложенные друг на друга или грязные предметы на грубом бетоне: картонные трубки, пищевые отходы, битое стекло, мятая бумага, куски металла, пластик и текстиль. Эти изображения сгруппированы в девять широких категорий, соответствующих тому, как на самом деле сортируют отходы на начальном этапе — например бумага, пластик, металл, органика и растительные остатки. Такой фокус на подлинных сценах делает систему гораздо более релевантной для реальной эксплуатации.
Очистка изображения перед принятием решения
Поскольку исходные снимки сильно загружены, команда сначала «очищает» их с помощью комбинации методов сегментации изображений. Вместо опоры на один подход они применяют четыре разных способа отделения переднего плана от фона, каждый из которых настроен выявлять разные визуальные подсказки — контраст, освещение или цветовые группы. Результаты объединяют так, чтобы сохранялись только те области, в которых несколько методов согласны в том, что это вероятные предметы отходов. Далее выполняется шаг разделения объектов, которые касаются или лежат друг на друге. В результате получается уточнённая маска, выделяющая только мусор и приглушающая путанные текстуры пола и окружения. Оригинальное изображение затем фильтруют через эту маску, чтобы нейронные сети видели в основном сам мусор, а не шум вокруг него.
Глубокие сети и гибридные модели учатся «видеть» мусор
Поверх этой предобработки исследователи дообучают широкий набор современных сетей распознавания изображений — сверточных нейронных сетей. Среди них популярные архитектуры: Inception, DenseNet, VGG, EfficientNet, MobileNet и несколько версий ResNet. Среди них особенно выделяется очень глубокая модель ResNet101, достигающая почти 99% точности и столь же высокого F1-показателя на данных RealWaste. Чтобы улучшить результаты дальше, авторы создают «гибридные» модели, объединяющие внутренние карты признаков двух разных сетей — например, сочетая сильную работу ResNet101 с текстурой и структурой и способность InceptionV3 анализировать объекты на разных масштабах. Такие гибриды оказываются особенно полезны для сложных категорий, таких как текстиль и прочие смешанные отходы, где предметы могут быть мятыми, порванными или частично скрытыми.
Проверка не только предсказания модели, но и её уверенности
Помимо чистой точности, в работе рассматривается ключевой вопрос для систем, которые могут работать на фабрике или в городском сортировочном центре: насколько модель уверена в каждой своей классификации? Для каждого предсказания сеть выдаёт коэффициент уверенности от 0 до 1, показывающий, насколько сильно она считает, что предмет принадлежит к данному классу. Авторы анализируют распределение этих оценок на тысячах тестовых изображений. Они обнаруживают, что для визуально отчётливых категорий — например растительность, пластиковые контейнеры и пищевые органические отходы — как лучшая одиночная модель, так и лучший гибрид обычно выдают очень высокую уверенность, часто выше 0.95. Более запутанные категории демонстрируют более широкий разброс оценок, сигнализируя о том, где могут понадобиться дополнительные проверки людьми или улучшение обучающих данных. Авторы также показывают, что добавление шага сегментации перед классификацией заметно повышает все ключевые метрики, от точности до F1.

К более надёжным и устойчивым системам управления отходами
Проще говоря, статья демонстрирует, что тщательно сконструированное сочетание очистки изображений, глубокого обучения и гибридного проектирования моделей может с высокой надёжностью распознавать мусор в реальных условиях, даже когда предметы грязные, наложены друг на друга или имеют необычную форму. ResNet101 показал себя мощным базовым решением, а гибридные модели добавляют прочности для самых трудных для обнаружения материалов. При прикреплении значимой оценки уверенности к каждому решению система не только сортирует отходы, но и сигнализирует о своей неуверенности, что прокладывает путь к более безопасной автоматизации. Хотя необходимы дальнейшие работы по уменьшению моделей для небольших устройств и испытаниям в полноразмерных системах в реальном времени, это исследование закладывает прочную основу для интеллектуальной сортировки отходов, которая поможет городам больше перерабатывать, отправлять на свалки меньше и снижать экологическую нагрузку от повседневного мусора.
Цитирование: Kumar, Y., Bhardwaj, P., Malhotra, S. et al. Deep residual and hybrid CNN models for confidence-aware real-world waste classification for sustainable waste management. Sci Rep 16, 10424 (2026). https://doi.org/10.1038/s41598-026-41001-8
Ключевые слова: классификация отходов, глубокое обучение, компьютерное зрение, системы переработки, устойчивое управление отходами