Clear Sky Science · pt

Aprendizado profundo para detecção de resíduos da construção usando atenção ConvNeXt V2 EMA e perda WIoU v3

2026-01-28 · Voltar ao índice

Por que a triagem mais inteligente de entulho de obras importa

Cada novo edifício, reforma ou demolição produz montanhas de entulho — concreto quebrado, tijolos, azulejos, madeira, espuma e mais. Grande parte desse material poderia ser reciclada, mas frequentemente acaba enterrada em aterros porque a separação manual é lenta, cara e propensa a erros. Este estudo explora como uma forma avançada de inteligência artificial pode reconhecer e classificar automaticamente diferentes tipos de resíduos de construção a partir de imagens, ajudando cidades a reduzir poluição, economizar matérias‑primas e avançar rumo a um uso verdadeiramente circular dos recursos de construção.

Entulho, recursos e um problema global em crescimento

Os resíduos de construção e demolição são hoje uma das correntes de resíduos que mais crescem no mundo, com cerca de um bilhão de toneladas geradas a cada ano. Essas pilhas de detritos ocupam terrenos, correm o risco de contaminar solo e água e desperdiçam materiais cuja produção demandou energia e emissões. Atualmente, o tratamento ainda depende muito de aterros e estocagem. Sistemas de visão automatizados que possam diferenciar rapidamente concreto de tijolo, azulejo de madeira ou espuma de drywall poderiam melhorar drasticamente as taxas de reciclagem. Porém, canteiros reais são caóticos: objetos se sobrepõem, estão cobertos de poeira e compartilham cores e texturas similares, tornando o reconhecimento automático confiável um desafio árduo.

Um novo “olho” digital para o entulho na correia transportadora

Os autores apresentam um sistema de detecção de objetos personalizado chamado YOLO‑CEW, construído sobre a popular família de modelos em tempo real YOLO. Eles o treinam em um conjunto de dados especializado com 1.774 imagens capturadas numa unidade de reciclagem em Chipre, contendo mais de 11.000 peças rotuladas de resíduos de construção e demolição em seis categorias comuns: concreto, tijolo, azulejo, drywall (gesso cartonado), madeira e espuma. As imagens são divididas em conjuntos separados para treino, validação e teste para evitar overfitting, e o modelo é executado múltiplas vezes com diferentes inicializações aleatórias para garantir robustez dos resultados. O objetivo é manter o sistema rápido o suficiente para uso em correias em movimento, ao mesmo tempo em que melhora significativamente a precisão na localização e rotulagem de cada fragmento de entulho.

Como a IA aprimorada enxerga melhor e aprende com seus erros

O YOLO‑CEW melhora o modelo base YOLOv8 em três aspectos principais. Primeiro, substitui o backbone extrator de características por uma versão mais nova chamada ConvNeXt V2 em estágios selecionados, que captura diferenças visuais sutis — como padrões finos que distinguem azulejos de concreto — sem desacelerar demais o sistema. Segundo, adiciona um módulo de Atenção Multi‑escala Eficiente (EMA) que ensina a rede a focar nas regiões mais informativas em diferentes escalas, aumentando sua capacidade de detectar tanto grandes lajes quanto pequenos fragmentos parcialmente ocultos, enquanto ignora ruídos de fundo. Terceiro, introduz uma função de perda atualizada, WIoU v3, que reduz o peso de palpites de caixa delimitadora muito ruins e concentra o aprendizado em exemplos mais promissores, ajudando o modelo a ajustar melhor suas caixas ao redor de objetos reais em vez de ser enganado por amostras ruidosas.

Testando o modelo em condições realistas

No conjunto de dados de resíduos de construção, o YOLO‑CEW alcança precisão de 96,84%, recall de 95,95% e uma pontuação geral de detecção (mAP@50) de 98,13%, todos acima da linha de base YOLOv8 original. Em termos práticos, isso significa que ele tanto perde menos objetos quanto gera menos alarmes falsos. O modelo é especialmente forte em distinguir classes desafiadoras como azulejos e espuma, embora haja alguma confusão entre tijolo e concreto quando a poeira borra limites. Importante, o sistema ainda roda a cerca de 128 quadros por segundo — bem acima do necessário para monitoramento em tempo real — tornando‑o adequado para linhas de reciclagem ativas. Testes estatísticos usando um procedimento bootstrap confirmam que esses ganhos não são devido ao acaso. Comparações com várias outras variantes do YOLO mostram que o YOLO‑CEW lidera consistentemente em precisão, mantendo um balanço favorável entre velocidade e desempenho.

Além de uma única planta: adaptando‑se a outros fluxos de resíduos

Para avaliar se a abordagem generaliza, os pesquisadores também testam o YOLO‑CEW em um conjunto de dados público separado para detecção de lixo que cobre materiais domésticos comuns, como plástico, vidro e papelão. Mesmo sem ter sido projetado especificamente para esse cenário novo, o modelo ainda supera o YOLOv8 padrão em precisão, recall e qualidade geral de detecção. Isso sugere que as melhorias arquiteturais — melhor extração de características, atenção mais inteligente e tratamento mais cuidadoso de exemplos de treino ruins — podem ser reutilizadas em outras tarefas de reciclagem e monitoramento ambiental, desde a triagem de resíduos domésticos até a detecção de lixo por drones.

O que isso significa para cidades mais limpas e inteligentes

Para não especialistas, a conclusão é que o YOLO‑CEW funciona como um sistema de câmera muito mais preciso e de visão mais apurada para entulho de construção. Ele pode observar um fluxo de detritos em movimento, identificar cada objeto e rotular de que material é feito com alta confiabilidade e velocidade. Isso facilita projetar linhas automatizadas onde máquinas separam e encaminham materiais para reutilização em vez de enterro. Apesar de desafios remanescentes — como lidar com desordem extrema, poeira e materiais raros — o estudo mostra que modelos de aprendizado profundo cuidadosamente ajustados podem transformar as pilhas de “resíduos” de hoje em fluxos de recursos amanhã, apoiando práticas de construção mais verdes e cidades mais inteligentes.

Citação: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3

Palavras-chave: resíduos da construção, IA para reciclagem, detecção de objetos, </keyword+cidades inteligentes> <keyword>aprendizado profundo