Clear Sky Science · es

Aprendizaje profundo para la detección de residuos de construcción usando atención ConvNeXt V2 EMA y pérdida WIoU v3

· Volver al índice

Por qué importa una clasificación más inteligente de los escombros

Cada nuevo edificio, reforma o demolición genera montañas de escombros: hormigón roto, ladrillos, baldosas, madera, espuma y más. Gran parte de este material podría reciclarse, pero a menudo acaba enterrado en vertederos porque clasificarlo a mano es lento, caro y propenso a errores. Este estudio explora cómo una forma avanzada de inteligencia artificial puede reconocer y clasificar automáticamente distintos tipos de residuos de construcción a partir de imágenes, ayudando a las ciudades a reducir la contaminación, ahorrar materias primas y avanzar hacia un uso realmente circular de los recursos constructivos.

Escombros, recursos y un problema global en crecimiento

Los residuos de construcción y demolición son hoy uno de los flujos de residuos de más rápido crecimiento en el mundo, con cerca de mil millones de toneladas generadas cada año. Estas pilas de desechos consumen suelo, arriesgan la contaminación del suelo y el agua, y desperdician materiales cuya producción implicó energía y emisiones. Actualmente, el tratamiento sigue dependiendo en gran medida del vertido y del acopio. Los sistemas de visión automatizados que puedan distinguir rápidamente el hormigón del ladrillo, la baldosa de la madera o la espuma del yeso podrían mejorar drásticamente las tasas de reciclaje. Pero los sitios de construcción reales son caóticos: los objetos se solapan, están cubiertos de polvo y comparten colores y texturas similares, lo que convierte el reconocimiento automático confiable en un desafío arduo.

Figure 1
Figure 1.

Un nuevo “ojo” digital para los residuos en la cinta transportadora

Los autores presentan un sistema de detección de objetos adaptado llamado YOLO‑CEW, construido sobre la popular familia de modelos de visión en tiempo real YOLO. Lo entrenan con un conjunto de datos especializado de 1.774 imágenes tomadas en una planta de reciclaje en Chipre, que contienen más de 11.000 piezas etiquetadas de residuos de construcción y demolición en seis categorías comunes: hormigón, ladrillo, baldosa, placa de yeso, madera y espuma. Las imágenes se dividen en conjuntos separados para entrenamiento, validación y prueba para evitar el sobreajuste, y el modelo se ejecuta varias veces con distintos inicios aleatorios para garantizar que los resultados sean robustos. El objetivo es mantener el sistema lo bastante rápido para su uso en cintas transportadoras en movimiento, al tiempo que mejora notablemente la precisión con que localiza y etiqueta cada fragmento de escombro.

Cómo la IA mejorada mira más de cerca y aprende de sus errores

YOLO‑CEW mejora el modelo base YOLOv8 en tres aspectos clave. Primero, reemplaza el backbone extractor de características por uno más reciente denominado ConvNeXt V2 en etapas seleccionadas, que captura mejor diferencias visuales sutiles —como los patrones finos que distinguen baldosas de hormigón— sin ralentizar demasiado el sistema. Segundo, añade un módulo Efficient Multi‑scale Attention (EMA) que enseña a la red a centrarse en las regiones más informativas a distintas escalas, aumentando su capacidad para detectar tanto losas grandes como fragmentos pequeños y parcialmente ocultos, mientras ignora el ruido del fondo. Tercero, introduce una función de pérdida de entrenamiento actualizada, WIoU v3, que resta peso a las conjeturas de cajas delimitadoras muy pobres y concentra el aprendizaje en ejemplos más prometedores, ayudando al modelo a ajustar mejor las cajas alrededor de objetos reales en lugar de dejarse llevar por muestras ruidosas.

Figure 2
Figure 2.

Poniendo el modelo a prueba en condiciones realistas

En el conjunto de datos de residuos de construcción, YOLO‑CEW alcanza una precisión del 96,84 %, una sensibilidad (recall) del 95,95 % y una puntuación global de detección (mAP@50) del 98,13 %, todas superiores a la línea base original YOLOv8. En términos prácticos, esto significa que pasa por alto menos objetos y genera menos falsas alarmas. El modelo es especialmente eficaz distinguiendo clases complicadas como baldosas y espuma, aunque persiste cierta confusión entre ladrillo y hormigón cuando el polvo difumina los límites. Es importante señalar que el sistema sigue funcionando a unos 128 fotogramas por segundo —muy por encima de lo necesario para monitorización en tiempo real— por lo que es apto para líneas de reciclaje activas. Pruebas estadísticas mediante un procedimiento bootstrap confirman que estas mejoras no se deben al azar. Comparaciones con varias otras variantes de YOLO muestran que YOLO‑CEW lidera consistentemente en exactitud manteniendo un equilibrio favorable entre velocidad y rendimiento.

Más allá de una planta: adaptación a otros flujos de residuos

Para comprobar si su enfoque se generaliza, los investigadores también prueban YOLO‑CEW en un conjunto de datos público independiente de detección de basura que cubre materiales domésticos comunes como plástico, vidrio y cartón. Incluso sin haberse diseñado específicamente para este nuevo entorno, el modelo supera al YOLOv8 estándar en precisión, recall y calidad global de detección. Esto sugiere que las mejoras arquitectónicas —mejor extracción de características, atención más inteligente y manejo más cuidadoso de ejemplos de entrenamiento pobres— podrían reutilizarse en otras tareas de reciclaje y monitorización ambiental, desde la clasificación de residuos domésticos hasta la detección de basura mediante drones.

Lo que esto significa para ciudades más limpias e inteligentes

Para los no especialistas, la conclusión es que YOLO‑CEW actúa como un sistema de cámara mucho más preciso y de mirada más aguda para los escombros de construcción. Puede vigilar un flujo de escombros en movimiento, identificar cada objeto y etiquetar de qué material está hecho con gran fiabilidad y rapidez. Esto facilita diseñar líneas automatizadas donde las máquinas separan y encaminan materiales para su reutilización en lugar de su enterramiento. Aunque persisten desafíos —como lidiar con un desorden extremo, mucho polvo y materiales poco frecuentes—, el estudio demuestra que modelos de aprendizaje profundo cuidadosamente ajustados pueden convertir las pilas actuales de “residuos” en flujos de recursos del mañana, apoyando prácticas de construcción más verdes y ciudades más inteligentes.

Cita: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3

Palabras clave: residuos de construcción, reciclaje IA, detección de objetos, ciudades inteligentes, aprendizaje profundo