Clear Sky Science · ru
Глубокое обучение для обнаружения строительного мусора с использованием внимания ConvNeXt V2 EMA и функции потерь WIoU v3
Зачем нужно умнее сортировать строительный мусор
Каждое новое строительство, ремонт или снос создают горы обломков — разрушенный бетон, кирпичи, плитку, древесину, пеноматериалы и прочее. Большую часть этих материалов можно переработать, но они часто оказываются на свалках, потому что ручная сортировка медленная, дорогая и подвержена ошибкам. В этом исследовании рассматривается, как продвинутая форма искусственного интеллекта может автоматически распознавать и сортировать разные типы строительного мусора по изображениям, помогая городам сокращать загрязнение, сохранять первичные ресурсы и двигаться к настоящей циркулярной экономике строительных материалов.
Обломки, ресурсы и растущая глобальная проблема
Отходы строительства и сноса сейчас — одна из самых быстрорастущих потоков отходов в мире: ежегодно образуется около миллиарда тонн. Эти груды обломков занимают землю, могут загрязнять почву и воду и растрачивают материалы, на производство которых уже затрачены энергия и выбросы. Сегодня их утилизация по‑прежнему во многом сводится к захоронению и складированию. Автоматические системы компьютерного зрения, которые быстро отличают бетон от кирпича, плитку от древесины или пеноматериал от гипсокартона, могли бы значительно повысить долю переработки. Но реальные строительные площадки хаотичны: объекты перекрывают друг друга, покрыты пылью и имеют похожие цвета и текстуры, что делает надёжное автоматическое распознавание непростой задачей.

Новое цифровое «око» для мусора на конвейере
Авторы предлагают специализированную систему обнаружения объектов под названием YOLO‑CEW, построенную на основе популярной семейства моделей YOLO для обработки изображений в реальном времени. Они обучают её на специализированном датасете из 1 774 изображений, снятых на перерабатывающем предприятии на Кипре, содержащем более 11 000 маркированных фрагментов строительных и сносных отходов по шести типичным категориям: бетон, кирпич, плитка, гипсокартон, древесина и пеноматериал. Изображения разделены на отдельные наборы для обучения, валидации и тестирования, чтобы избежать переобучения, а модель запускают несколько раз с разными случайными инициализациями, чтобы результаты были устойчивыми. Цель — сохранить скорость системы достаточной для работы на движущихся конвейерах и одновременно значительно повысить точность обнаружения и маркировки каждого куска мусора.
Как усовершенствованный ИИ смотрит внимательнее и учится на ошибках
YOLO‑CEW улучшает базовую модель YOLOv8 в трёх ключевых аспектах. Во‑первых, на определённых этапах она заменяет базовый экстрактор признаков на более современную архитектуру ConvNeXt V2, которая лучше улавливает тонкие визуальные различия — например, мелкие узоры, отличающие плитку от бетона — без значительного снижения скорости. Во‑вторых, добавлен модуль Efficient Multi‑scale Attention (EMA), который обучает сеть фокусироваться на наиболее информативных областях на разных масштабах, повышая способность находить как крупные плиты, так и мелкие частично скрытые фрагменты и игнорировать отвлекающий фон. В‑третьих, введена обновлённая функция потерь WIoU v3, которая снижает вклад очень плохих предположений о границах и концентрирует обучение на более перспективных примерах, помогая модели точнее обводить реальные объекты вместо того, чтобы её сбивали шумные образцы.

Тестирование модели в реалистичных условиях
На датасете строительных отходов YOLO‑CEW достигает точности (precision) 96,84%, полноты (recall) 95,95% и общей метрики обнаружения (mAP@50) 98,13%, что превышает показатели исходной YOLOv8. Практически это означает, что модель пропускает меньше объектов и делает меньше ложных срабатываний. Модель особенно хорошо различает сложные классы, такие как плитка и пеноматериал, хотя некоторая путаница между кирпичом и бетоном остаётся, когда пыль размывает границы. Важно, что система по‑прежнему работает примерно на 128 кадрах в секунду — намного выше требований для мониторинга в реальном времени — поэтому она подходит для использования на действующих линиях переработки. Статистические тесты с бутстрэп‑процедурой подтверждают, что эти улучшения не случайны. Сравнения с несколькими другими вариантами YOLO показывают, что YOLO‑CEW постоянно лидирует по точности, сохраняя при этом выгодный баланс между скоростью и производительностью.
За пределами одного завода: адаптация к другим потокам отходов
Чтобы проверить обобщаемость подхода, исследователи также испытывают YOLO‑CEW на отдельном публичном датасете для обнаружения бытового мусора, включающем распространённые материалы вроде пластика, стекла и картона. Даже без специфической настройки под эту среду модель всё же превосходит стандартную YOLOv8 по точности, полноте и общей качественной оценке обнаружения. Это указывает на то, что архитектурные улучшения — лучшее извлечение признаков, более интеллектуальное внимание и более аккуратная обработка плохих обучающих примеров — могут быть повторно использованы в других задачах переработки и экологического мониторинга, от сортировки бытовых отходов до обнаружения мусора с помощью дронов.
Что это значит для чище и умнее городов
Для неспециалистов вывод в том, что YOLO‑CEW действует как гораздо более точная и зоркая «камера» для строительного мусора. Она может следить за движущимся потоком обломков, выделять каждый объект и с очень высокой надёжностью и скоростью определять, из какого он материала. Это значительно облегчает проектирование автоматизированных линий, где машины сортируют и направляют материалы на повторное использование вместо захоронения. Хотя остаются вызовы — например, экстремальная захламлённость, пыль и редко встречающиеся материалы — исследование показывает, что тщательно настроенные модели глубокого обучения способны превратить сегодняшние кучи «отходов» в завтрашние потоки ресурсов, поддерживая более экологичное строительство и умные города.
Цитирование: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3
Ключевые слова: строительный мусор, ИИ для переработки, обнаружение объектов, умные города, глубокое обучение