Clear Sky Science · ru

ResSeMo: интеграция глубоких сверточных нейронных сетей для высокоточной классификации отходов и эффективной обработки

· Назад к списку

Почему умная сортировка мусора важна

Каждый день города по всему миру сталкиваются с горой смешанных отходов. Когда бутылки, банки, пищевые отходы и батарейки попадают в один контейнер, перерабатывать их безопасно становится сложнее и дороже. В этой статье представлен ResSeMo — новая система компьютерного зрения, которая обучает машины быстро и надёжно распознавать разные виды мусора даже в уличных сценах, помогая сделать наши районы чище и повысить эффективность переработки.

Figure 1. Система «умного зрения» превращает смешанный городской мусор в аккуратно сортированные потоки для переработки и безопасной утилизации.
Figure 1. Система «умного зрения» превращает смешанный городской мусор в аккуратно сортированные потоки для переработки и безопасной утилизации.

Растущая гора городских отходов

Урбанизация резко увеличила объём мусора, который производят люди. Традиционные методы сортировки зависят от работников и простых машин, которые часто ошибаются более чем в четверти случаев. Это значит, что ценные материалы закапываются или сжигаются вместо повторного использования, а опасные предметы, такие как батарейки, проходят незамеченными. Исследователи обратились к современному распознаванию изображений: камеры и алгоритмы анализируют фото мусора и решают, является ли предмет стеклом, пластиком, бумагой, металлом или чем-то другим. Однако многие существующие системы либо медленные и тяжёлые, либо хорошо работают только в чистых, контролируемых лабораторных условиях, но не на захламлённых тротуарах или в заполненных контейнерах.

Новый трёхчастный «мозг» для мусора

ResSeMo решает эту задачу, комбинируя три типа модулей нейронных сетей в единый скоординированный «мозг». Первая часть специализируется на обнаружении богатых визуальных деталей на нескольких масштабах — таких как текстура, контуры и блеск — чтобы отличать стеклянную бутылку от пластиковой. Вторая часть работает как прожектор, усиливая наиболее важные визуальные признаки — например, следы коррозии на металле или типичные узоры на батарейках — и одновременно ослабляя отвлекающий фон. Финальная часть ориентирована на минимизацию вычислений, позволяя системе работать на небольших устройствах, таких как умные контейнеры или энергоэффективные датчики, без большого расхода памяти и энергии. Вместе они образуют пошаговый конвейер, превращающий беспорядочные изображения в уверенные решения о категориях.

Обучение на реальном мусоре

Для проверки ResSeMo авторы использовали две крупные коллекции изображений. Первая, TrashNet, содержит несколько тысяч фото, сделанных в простых условиях, где каждый объект чётко виден и центрирован. Вторая, TACO, намного крупнее и ближе к реальности — там мусор разбросан на улицах, в парках и в углах помещений, часто мелкий, частично скрытый или плохо освещённый. Команда тщательно подготовила эти данные: согласовала метки категорий между двумя источниками, увеличила количество примеров стандартными приёмами вроде поворота и изменения яркости, а также расширила области вокруг очень маленьких объектов, таких как крышки от бутылок, чтобы модели было легче их увидеть. Они также добавили дополнительные метки, описывающие степень загрязнённости и объёмность предмета, чтобы позднее проанализировать, как решения по сортировке могут повлиять на последующую цепочку обращения с отходами.

Figure 2. Пошаговый обзор того, как компактный ИИ фильтрует изображения мусора, чтобы точно разделять разные типы отходов.
Figure 2. Пошаговый обзор того, как компактный ИИ фильтрует изображения мусора, чтобы точно разделять разные типы отходов.

Испытание модели

ResSeMo сравнили с десятью известными сетями, включая тяжеловесов, часто используемых в научных исследованиях, и более лёгкие модели, рассчитанные на телефоны. На более простых фотографиях из TrashNet новая система правильно классифицировала чуть более девяти из десяти предметов, при этом требуя существенно меньше вычислений, чем самые мощные конкуренты. На более сложных изображениях TACO она по‑прежнему распознавала почти 87 процентов предметов правильно и сохраняла небольшое время обработки. Модель также показала устойчивость в трудных условиях: когда исследователи добавляли шум, размытие, недостаток света, блики или симулировали плохую погоду, точность ResSeMo падала лишь умеренно и оставалась выше, чем у соперников. Дополнительные тесты на малых платформах вроде NVIDIA Jetson Nano и Raspberry Pi показали, что сжатая версия может работать с низким потреблением энергии и памяти, что делает её пригодной для устройств, внедряемых в полевых условиях.

Что это значит для повседневной жизни

Проще говоря, ResSeMo демонстрирует возможность построения системы сортировки мусора, которая одновременно точна и практична. Сочетая мощное распознавание шаблонов с конструкцией, подходящей для малой энергоэффективной аппаратуры, подход помогает сократить разрыв между исследованиями и реальными контейнерами на улицах. Хотя требуется дополнительная работа для обработки редких типов отходов или экстремальных условий, это исследование показывает перспективный путь для городов, стремящихся автоматизировать первичную сортировку, возвращать больше материалов в оборот и не допускать попадания опасных предметов на свалки и в мусоросжигательные установки.

Цитирование: Liu, T., Li, B. & Wang, Z. ResSeMo: deep convolutional neural network integration for high-accuracy waste classification and efficient processing. Sci Rep 16, 15167 (2026). https://doi.org/10.1038/s41598-026-45814-5

Ключевые слова: классификация отходов, глубокое обучение, умная переработка, edge AI, городская санитария