Clear Sky Science · ar

خوارزمية كشف الأجسام للأنقاض الإنشائية تعتمد على آلية اهتمام مجمعة متسلسلة

· العودة إلى الفهرس

لماذا تكتسب فرز النفايات الذكي أهمية

في كل مرة يُشيَّد مبنى أو يُهدم، تتكوّن جبال من الحطام—قطع خرسانية، طوب مكسور، بلاط، خشب، معدن وبلاستيك. تشكل هذه النفايات الإنشائية نحو 40% من النفايات في العديد من المدن. ومدفونة داخل هذا الركام مواد ثمينة يمكن تدويرها لإنتاج منتجات بناء جديدة، لكن اليوم يتم تنفيذ كثير من الفرز يدوياً، وهو أمر بطيء ومكلف وخطير. يعرض هذا البحث نظام رؤية حاسوبية جديد قادر على اكتشاف وتصنيف أنواع مختلفة من نفايات البناء والهدم تلقائياً في الوقت الحقيقي، حتى عندما تكون القطع صغيرة أو متداخلة أو متشابهة جداً في المظهر.

Figure 1
Figure 1.

التحدي المتمثل في رؤية النظام لترتيب داخل كتلة من الأنقاض

فرز حطام البناء المختلط أصعب مما يبدو على الآلات. فمثلاً، غالباً ما تشترك قطع الخرسانة وبلاط السيراميك في ألوان وملمس مشابهين، مما يسهل الخلط بينها. في المشاهد الواقعية تجلس القطع الكبيرة بجانب الشظايا الصغيرة، والعديد من الأشياء مخفية جزئياً، ويمكن أن يغير الإضاءة أو زاوية الكاميرا مظهر المواد. الأنظمة السابقة القائمة على الذكاء الاصطناعي لهذه المهمة إما كانت تفتقر للدقة، أو كانت تعاني مع العناصر الصغيرة جداً، أو كانت تتطلب قدرة حسابية كبيرة غير واقعية للاستخدام على خطوط الفرز والمعدات المتنقلة. يركز المؤلفون على تحسين فئة شائعة من نماذج كشف الأجسام السريعة المعروفة باسم YOLO لتتعامل بشكل أفضل مع هذه المشاهد الفوضوية دون إبطاء الأداء.

طريقة جديدة ليولي الشبكة الانتباه

جوهر الطريقة الجديدة هو إعادة تصميم "العمود الفقري" الذي يعالج الصور على مراحل، مستلهمًا من نماذج المحولات المستخدمة في اللغة والرؤية. بدلاً من التعامل مع الصورة على أنها رقع محلية صغيرة فقط، تتعلم الشبكة كيف ترتبط المناطق البعيدة ببعضها، مما يساعد عندما تتداخل الأجسام أو تندمج مع الخلفية. وللقيام بذلك بكفاءة، قدم المؤلفون آلية اهتمام مجمعة متسلسلة. يقسمون التمثيل الداخلي للصورة إلى مجموعات، ويسمح لكل مجموعة بالتركيز على الأنماط داخل نفسها، ثم ينقلون المعلومات تدريجياً من مجموعة إلى أخرى. يتيح هذا الأسلوب "التركيز المحلي أولاً، والتنقية العالمية لاحقاً" للنموذج تسليط الضوء على الفروقات الدقيقة بين، على سبيل المثال، الخرسانة والسيراميك، مع الحفاظ على استهلاك الذاكرة والحساب منخفضًا بما يكفي للاستخدام في الوقت الحقيقي.

مراقبة النفايات على عدة مقاييس في آن واحد

إلى جانب التعرف على نوع المادة، يجب أن يجد النظام أيضاً أجسامًا ذات أحجام مختلفة جداً، من الشظايا الصغيرة إلى العوارض الكبيرة. لذلك يستخدم النموذج طبقات متعددة تعمل كل منها عند دقة صورة مختلفة. يتيح وحدة تفاعل مخصصة تدفق المعلومات من الطبقات粗برية ذات الصورة العامة إلى الطبقات الدقيقة التفصيلية والعكس بالعكس. تساهم الطبقات الخشنة بالسياق العام—أين تقع الأكوام وكيف تتجمع الأشياء—بينما تضيف الطبقات الدقيقة الحواف الحادة والأنسجة. بعد ذلك يبرز مكوّن انتباه مكاني المناطق الأكثر معلوماتية عند كل مقياس ويكبح الخلفية المشتتة. وأخيراً، تتنبأ فروع كشف منفصلة عند كل دقة بمواقع الأجسام ونوع المادة التي تنتمي إليها، مع إعداد تدريبي يشجع على وضع صناديق دقيقة وتوازن مقايضة بين العثور على العديد من الأجسام وتجنب الإنذارات الكاذبة.

Figure 2
Figure 2.

اختبار النظام

لتقييم منهجهم استخدم الباحثون مجموعتي بيانات عامتين لنفايات البناء والهدم. الأولى، المسماة BTC، تحتوي صوراً للطوب والبلاط والخرسانة؛ والأخرى، SWP، تركز على الصلب والخشب والبلاستيك وتشمل آلاف الصور عالية الدقة. قارن الفريق طريقتهم بعدة إصدارات موجودة من نماذج YOLO تم تكييفها لهذه المهمة. حقق نظامهم درجات كشف أعلى بشكل ملحوظ في كلتا المجموعتين، خصوصاً في المقياس الأصعب الذي يقيس مدى تطابق الصناديق المتوقعة مع الحدود الحقيقية للأجسام. كان أداءه قوياً بشكل خاص في الحفاظ على نسبة استرجاع عالية جداً—مما يعني فقدان عدد قليل جداً من الأجسام—مع إبقاء العبء الحسابي العام معتدلاً، منافساً أو أقل من العديد من النماذج المنافسة.

ماذا يعني هذا لإعادة التدوير في العالم الواقعي

للغير متخصصين، الخلاصة أن المؤلفين بنوا "عين" أكثر ذكاءً لفرز حطام البناء، قادرة على تمييز المواد القابلة لإعادة التدوير في مشاهد مزدحمة وفوضوية أفضل من الأدوات السابقة. من خلال دمج آليات اهتمام فعالة مع معالجة متعددة المقاييس، يلتقط النظام القطع الصغيرة والمتداخلة بدقة أكبر، مع الاستمرار في العمل بسرعة كافية لتكون عملية على الأجهزة الصناعية. لا تزال هناك بعض حالات الارتباك بين النفايات والخلفية، لكن الأداء العام قوي ومستقر عبر مجموعات بيانات مختلفة. على المدى البعيد، قد تساعد مثل هذه التحسينات مرافق إعادة التدوير على استرجاع مزيد من المواد الثمينة بجهد يدوي أقل، وتقليل استخدام المدافن، وجعل صناعة البناء أنظف وأكثر كفاءة في استخدام الموارد.

الاستشهاد: Jiang, Z., Yang, Y., Hu, J. et al. A cascaded group attention mechanism-based object detection algorithm for construction and demolition waste. Sci Rep 16, 11798 (2026). https://doi.org/10.1038/s41598-026-41557-5

الكلمات المفتاحية: كشف نفايات البناء, رؤية عميقة التعلم, إعادة التدوير الآلي, كشف الأجسام, آليات الانتباه