Clear Sky Science · ar

التعلّم العميق لكشف نفايات البناء باستخدام تركيز ConvNeXt V2 EMA وخسارة WIoU v3

· العودة إلى الفهرس

لماذا يهم فرز حطام المباني بشكل أذكى

كل مبنى جديد أو ترميم أو هدم يؤدي إلى جبال من الحطام—خرسانة مكسورة، قِرميد، بلاط، خشب، رغوة، والمزيد. الكثير من هذه المواد يمكن إعادة تدويرها، ومع ذلك غالباً ما ينتهي بها المطاف في المكبات لأن الفرز اليدوي بطيء ومكلّف ومعرض للأخطاء. تستكشف هذه الدراسة كيف يمكن لشكل متقدم من الذكاء الاصطناعي أن يتعرّف تلقائياً على أنواع نفايات البناء من الصور ويفرزها، مما يساعد المدن على خفض التلوّث، والحفاظ على المواد الخام، والاقتراب من الاستخدام الدائري للموارد البنائية.

حطام وموارد ومشكلة عالمية متزايدة

أصبحت نفايات البناء والهدم الآن من أسرع تيارات النفايات نمواً في العالم، حيث تُنتج نحو مليار طن سنوياً. تستهلك أكوام الحطام هذه الأراضي، وتعرّض التربة والمياه لخطر التلوّث، وتبذّر مواد استهلكت طاقة وانبعاثات لإنتاجها في الأصل. اليوم لا يزال التعامل معها يعتمد بشدّة على الطمر والتكديس. يمكن لأنظمة رؤية آلية قادرة على التمييز بسرعة بين الخرسانة والطوب، والبلاط والخشب، أو الرغوة ولوح الجبس أن تحسّن معدلات إعادة التدوير بشكل كبير. ومع ذلك، فإن مواقع البناء الواقعية فوضوية: تتداخل الأشياء، وتغطيها الأتربة، وتشارك ألواناً وملمساً متشابهة، مما يجعل التعرف الآلي الموثوق تحدياً صعباً.

Figure 1
Figure 1.

«عين» رقمية جديدة للنفايات على حزام النقل

يقدّم المؤلفون نظام كشف أشياء مُخصّصاً يُدعى YOLO‑CEW، مبنياً على عائلة نماذج الرؤية في الزمن الحقيقي الشهيرة YOLO. درّبوا النموذج على مجموعة بيانات متخصصة مكوّنة من 1774 صورة مأخوذة في منشأة إعادة تدوير في قبرص، تحتوي على أكثر من 11,000 قطعة مُعلّمة من نفايات البناء والهدم عبر ست فئات شائعة: خرسانة، طوب، بلاط، لوح جبس، خشب، ورغوة. قُسّمت الصور إلى مجموعات للتدريب والتحقق والاختبار لتجنّب الإفراط في التكيّف، وشُغّل النموذج عدة مرات ببدايات عشوائية مختلفة لضمان صلابة النتائج. الهدف هو الحفاظ على سرعة كافية لاستخدامه على أحزمة نقل متحركة مع تحسين كبير في دقة اكتشاف وتوصيف كل قطعة من الحطام.

كيف ترى النسخة المحسّنة أكثر وتتعلم من أخطائها

يحسّن YOLO‑CEW النموذج الأساسي YOLOv8 في ثلاثة جوانب رئيسية. أولاً، يستبدل العمود الفقري لاستخلاص الميزات بنسخة أحدث تُسمّى ConvNeXt V2 في مراحل محددة، وهي أفضل في التقاط الفروق البصرية الدقيقة—مثل الأنماط الدقيقة التي تميّز البلاط عن الخرسانة—دون إبطاء النظام بشكل كبير. ثانياً، يضيف وحدة انتباه متعددة المقاييس الفعّالة (EMA) التي تعلم الشبكة التركيز على المناطق الأكثر معلوماتية عبر أحجام مختلفة، مما يعزّز قدرتها على العثور على الألواح الكبيرة والقطع الصغيرة المخبأة جزئياً مع تجاهل الفوضى الخلفية المشتّتة. ثالثاً، يقدّم دالة خسارة تدريب محدثة، WIoU v3، التي تقلّل وزن تخمينات الصناديق الحدودية الضعيفة للغاية وتوجّه التعلم نحو أمثلة أكثر واعدة، مما يساعد النموذج على تضييق صناديقه حول الأجسام الحقيقية بدلاً من الالتباس بعينات ضوضائية.

Figure 2
Figure 2.

وضع النموذج للاختبار في ظروف واقعية

على مجموعة بيانات نفايات البناء، يحقق YOLO‑CEW دقّة (Precision) بنسبة 96.84%، واستدعاء (Recall) بنسبة 95.95%، ومؤشر كشف إجمالي (mAP@50) بنسبة 98.13%، وهي أعلى من خط الأساس الأصلي YOLOv8. عملياً، يعني هذا أنه يفوّت عددًا أقل من الأجسام ويصدر تنبيهات خاطئة أقل. النموذج قوي بشكل خاص في تمييز فئات صعبة مثل البلاط والرغوة، رغم وجود بعض الالتباس بين الطوب والخرسانة عندما تُطمس الحدود بسبب الغبار. والأهم، أن النظام لا يزال يعمل عند نحو 128 إطاراً في الثانية—أعلى بكثير مما هو مطلوب للمراقبة في الزمن الحقيقي—لذلك فهو مناسب للاستخدام على خطوط إعادة التدوير النشطة. تؤكد اختبارات إحصائية باستخدام إجراء bootstrap أن هذه المكاسب ليست مصادفة. ومقارنات مع عدة متغيرات من YOLO تظهر أن YOLO‑CEW يتصدر باستمرار من حيث الدقة مع الحفاظ على توازن مناسب بين السرعة والأداء.

ما يفوق منشأة واحدة: التكيّف مع تيارات نفايات أخرى

لاختبار مدى تعميم منهجهم، اختبر الباحثون أيضاً YOLO‑CEW على مجموعة بيانات عامة منفصلة لكشف النفايات تغطي مواد منزلية شائعة مثل البلاستيك والزجاج والورق المقوّى. حتى دون تصميم خاص لهذا الإعداد الجديد، لا يزال النموذج يتفوّق على YOLOv8 القياسي في الدقّة والاستدعاء وجودة الكشف الإجمالية. وهذا يشير إلى أن التحسينات المعمارية—استخلاص ميزات أفضل، انتباه أذكى، وتعامل أكثر حرصاً مع أمثلة التدريب الضعيفة—يمكن إعادة استخدامها في مهام إعادة التدوير ومراقبة البيئة الأخرى، من فرز النفايات المنزلية إلى كشف القمامة بواسطة الطائرات المسيرة.

ما يعنيه هذا لمدن أنظف وأكثر ذكاءً

بالنسبة لغير المتخصصين، الخلاصة أن YOLO‑CEW يعمل كأنّه نظام تصوير أدق وأوضح لنفايات البناء. يمكنه مراقبة تيار متحرك من الحطام، تمييز كل جسم، وتسميته بالمادة المصنوع منها بمستوى موثوقية وسرعة عالٍ جداً. هذا يجعل تصميم خطوط آلية لفرز وتوجيه المواد لإعادة الاستخدام بدلاً من الطمر أمراً أسهل بكثير. ومع بقاء تحديات—مثل التعامل مع الفوضى الشديدة والغبار والمواد النادرة الظهور—تُظهر الدراسة أن نماذج التعلّم العميق المضبوطة بعناية قادرة على تحويل أكوام “النفايات” اليوم إلى تيارات موارد الغد، داعمة ممارسات بناء أكثر خضرة ومدناً أكثر ذكاءً.

الاستشهاد: Han, D., Ma, M., Li, X. et al. Deep learning for construction waste detection using ConvNeXt V2 EMA attention and WIoU v3 loss. Sci Rep 16, 6441 (2026). https://doi.org/10.1038/s41598-026-37473-3

الكلمات المفتاحية: نفايات البناء, الذكاء الاصطناعي لإعادة التدوير, كشف الأجسام, المدن الذكية, التعلّم العميق