Clear Sky Science · ru

Глубокое обучение для обнаружения строительного мусора с использованием внимания ConvNeXt V2 EMA и функции потерь WIoU v3

· Назад к списку

Зачем нужно умнее сортировать строительный мусор

Каждое новое строительство, ремонт или снос создают горы обломков — разрушенный бетон, кирпичи, плитку, древесину, пеноматериалы и прочее. Большую часть этих материалов можно переработать, но они часто оказываются на свалках, потому что ручная сортировка медленная, дорогая и подвержена ошибкам. В этом исследовании рассматривается, как продвинутая форма искусственного интеллекта может автоматически распознавать и сортировать разные типы строительного мусора по изображениям, помогая городам сокращать загрязнение, сохранять первичные ресурсы и двигаться к настоящей циркулярной экономике строительных материалов.

Обломки, ресурсы и растущая глобальная проблема

Отходы строительства и сноса сейчас — одна из самых быстрорастущих потоков отходов в мире: ежегодно образуется около миллиарда тонн. Эти груды обломков занимают землю, могут загрязнять почву и воду и растрачивают материалы, на производство которых уже затрачены энергия и выбросы. Сегодня их утилизация по‑прежнему во многом сводится к захоронению и складированию. Автоматические системы компьютерного зрения, которые быстро отличают бетон от кирпича, плитку от древесины или пеноматериал от гипсокартона, могли бы значительно повысить долю переработки. Но реальные строительные площадки хаотичны: объекты перекрывают друг друга, покрыты пылью и имеют похожие цвета и текстуры, что делает надёжное автоматическое распознавание непростой задачей.

Figure 1
Figure 1.

Новое цифровое «око» для мусора на конвейере

Авторы предлагают специализированную систему обнаружения объектов под названием YOLO‑CEW, построенную на основе популярной семейства моделей YOLO для обработки изображений в реальном времени. Они обучают её на специализированном датасете из 1 774 изображений, снятых на перерабатывающем предприятии на Кипре, содержащем более 11 000 маркированных фрагментов строительных и сносных отходов по шести типичным категориям: бетон, кирпич, плитка, гипсокартон, древесина и пеноматериал. Изображения разделены на отдельные наборы для обучения, валидации и тестирования, чтобы избежать переобучения, а модель запускают несколько раз с разными случайными инициализациями, чтобы результаты были устойчивыми. Цель — сохранить скорость системы достаточной для работы на движущихся конвейерах и одновременно значительно повысить точность обнаружения и маркировки каждого куска мусора.

Как усовершенствованный ИИ смотрит внимательнее и учится на ошибках

YOLO‑CEW улучшает базовую модель YOLOv8 в трёх ключевых аспектах. Во‑первых, на определённых этапах она заменяет базовый экстрактор признаков на более современную архитектуру ConvNeXt V2, которая лучше улавливает тонкие визуальные различия — например, мелкие узоры, отличающие плитку от бетона — без значительного снижения скорости. Во‑вторых, добавлен модуль Efficient Multi‑scale Attention (EMA), который обучает сеть фокусироваться на наиболее информативных областях на разных масштабах, повышая способность находить как крупные плиты, так и мелкие частично скрытые фрагменты и игнорировать отвлекающий фон. В‑третьих, введена обновлённая функция потерь WIoU v3, которая снижает вклад очень плохих предположений о границах и концентрирует обучение на более перспективных примерах, помогая модели точнее обводить реальные объекты вместо того, чтобы её сбивали шумные образцы.

Figure 2
Figure 2.

Тестирование модели в реалистичных условиях

На датасете строительных отходов YOLO‑CEW достигает точности (precision) 96,84%, полноты (recall) 95,95% и общей метрики обнаружения (mAP@50) 98,13%, что превышает показатели исходной YOLOv8. Практически это означает, что модель пропускает меньше объектов и делает меньше ложных срабатываний. Модель особенно хорошо различает сложные классы, такие как плитка и пеноматериал, хотя некоторая путаница между кирпичом и бетоном остаётся, когда пыль размывает границы. Важно, что система по‑прежнему работает примерно на 128 кадрах в секунду — намного выше требований для мониторинга в реальном времени — поэтому она подходит для использования на действующих линиях переработки. Статистические тесты с бутстрэп‑процедурой подтверждают, что эти улучшения не случайны. Сравнения с несколькими другими вариантами YOLO показывают, что YOLO‑CEW постоянно лидирует по точности, сохраняя при этом выгодный баланс между скоростью и производительностью.

За пределами одного завода: адаптация к другим потокам отходов

Чтобы проверить обобщаемость подхода, исследователи также испытывают YOLO‑CEW на отдельном публичном датасете для обнаружения бытового мусора, включающем распространённые материалы вроде пластика, стекла и картона. Даже без специфической настройки под эту среду модель всё же превосходит стандартную YOLOv8 по точности, полноте и общей качественной оценке обнаружения. Это указывает на то, что архитектурные улучшения — лучшее извлечение признаков, более интеллектуальное внимание и более аккуратная обработка плохих обучающих примеров — могут быть повторно использованы в других задачах переработки и экологического мониторинга, от сортировки бытовых отходов до обнаружения мусора с помощью дронов.

Что это значит для чище и умнее городов

Для неспециалистов вывод в том, что YOLO‑CEW действует как гораздо более точная и зоркая «камера» для строительного мусора. Она может следить за движущимся потоком обломков, выделять каждый объект и с очень высокой надёжностью и скоростью определять, из какого он материала. Это значительно облегчает проектирование автоматизированных линий, где машины сортируют и направляют материалы на повторное использование вместо захоронения. Хотя остаются вызовы — например, экстремальная захламлённость, пыль и редко встречающиеся материалы — исследование показывает, что тщательно настроенные модели глубокого обучения способны превратить сегодняшние кучи «отходов» в завтрашние потоки ресурсов, поддерживая более экологичное строительство и умные города.

Цитирование: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3

Ключевые слова: строительный мусор, ИИ для переработки, обнаружение объектов, умные города, глубокое обучение