Clear Sky Science · ar

نسخة أسرع R-CNN متكيِّفة مع النطاق لتحديد غياب معدات الوقاية الشخصية في مواقع البناء من صور مثبتة على الجسم والصور العامة

2026-01-07 · العودة إلى الفهرس

لماذا يظل غياب معدات السلامة يمر دون اكتشاف

الخِرَق، والسترات العاكسة، والأقنعة، والقفازات، والأحذية المتينة من المفترض أن تكون غير قابلة للتفاوض في مواقع البناء، ومع ذلك تحدث هفوات — وقد تكون مميتة. تعتمد العديد من المشاريع الآن على الكاميرات والذكاء الاصطناعي لإشارة العمال الذين يفتقدون المعدات المطلوبة، لكن هذه الأنظمة تواجه صعوبة لأن المخالفات الحقيقية نادرة ويصعب التقاطها على الفيديو. تستكشف هذه الدراسة طريقة لتدريب أنظمة كشف أذكى عن طريق استعارة أمثلة من صور الشارع العادية، مما يجعل فحوصات السلامة الآلية أكثر موثوقية دون انتظار تراكم الحوادث أو المخالفات.

تحويل الصور اليومية إلى دروس سلامة

الفكرة الأساسية بسيطة: الأشخاص في الأماكن العامة أو المكاتب نادراً ما يرتدون معدات البناء، لذا الصور من تلك البيئات مليئة بأمثلة عن «ما لا ينبغي ارتداؤه» في موقع العمل. التحدي أن هذه المشاهد تبدو مختلفة جداً عن العمل الإنشائي — الخلفيات، والإضاءة، وزوايا الكاميرا تُغيّر مظهر الأشخاص. يعامل الباحث هذين العالمين كـ "نطاقين" مختلفين: نطاق مصدر يحتوي على أمثلة وفيرة لغياب معدات الحماية من الصور العامة، ونطاق مستهدف به صور مواقع بناء أقل لكنها أكثر واقعية، كثيراً ما تُسجَّل بكاميرات مثبتة على خوذ العمال. تظهر الورقة أنه من خلال محاذاة ما يتعلمه الحاسوب بعناية من كلا النطاقين، يمكن للنظام اكتشاف غياب المعدات في المواقع الحقيقية بدقة أعلى بكثير مما لو دُرب على بيانات البناء وحدها.

كيف يرى فاحص السلامة الجديد المشهد

البحث يبني على نظام كشف أجسام شائع يسمى Faster R‑CNN، الذي يمسح الصورة، يقترح مناطق قد تحتوي على أشخاص أو أجزاء من الجسم، ثم يصنف ما يراه داخل كل صندوق. هنا، يُدرَّب الكاشف للتعرّف على خمسة أنواع من غياب المعدات: عدم ارتداء خوذة، عدم ارتداء قناع، عدم ارتداء قفاز، عدم ارتداء سترة، وعدم ارتداء أحذية سلامة. قبل إرسال الصور إلى النموذج، تُجرى عليها تعديلات كبيرة — تبييض أو تعتيم، تدوير، طمس وتشويه — لمحاكاة الكاميرات المهتزة، وضوء الشمس القاسي، والزوايا المحرجة الشائعة في المواقع المزدحمة. تساعد هذه التنويعات الاصطناعية النموذج على الثبات عندما يكون لقط الواقع الفعلي أقل من المثالي، كما يحدث عادة عند تسجيله بكاميرات مثبتة على الجسم.

تعليم النظام تجاهل الخلفية

الخلط البسيط بين صور الشارع ولقطات البناء غير كافٍ؛ فقد يتعلم النموذج ربط غياب المعدات بالأرصفة بدل ربطه بالأشخاص. لمنع ذلك، تقدم الدراسة وحدات "تكيُّف النطاق" التي تدفع النظام بلطف للتركيز على الأشخاص والملابس بدلاً من المشهد المحيط. تنظر وحدة واحدة إلى الصورة ككل، فتعيد توجيه الشبكة بحيث تنتج صور البناء وغير البناء أنماطاً كلية مشابهة، رغم اختلاف الإضاءة أو المعدات. تعمل وحدة أخرى على مستوى كل شخص مكتشف، فتتأكد من أن الطابع البصري لرأس غير محمي مثلاً يبدو مشابهاً سواء ظهر على سقالة أو في شارع تسوّق. تُدرَّب هذه الوحدات بطريقة خصمية: مُصَنِّف صغير يحاول معرفة أي نطاق أتت منه الصورة، بينما يتعلّم الشبكة الرئيسية إخفاء تلك المعلومة، محافظةً على تركيزها على معدات الحماية بدلاً من الخلفية.

تجريب المنهج

جمع المؤلف مجموعة بيانات كبيرة بدمج لقطات من كاميرات مثبتة على الجسم من خمسة مواقع بناء في كوريا الجنوبية مع عدة مجموعات صور عامة. بعد وسم كل حالة غياب خوذات، وأقنعة، وقفازات، وسترات، وأحذية سلامة يدوياً، درَّبت الدراسة مئات النماذج مع أُطر شبكات عصبية وخيارات معلمة مختلفة. أفضل نموذج استخدم شبكة عميقة تسمى ResNet‑152 مع تعديل صور قوي ووحدات تكيُّف النطاق. على صور بناء لم تُرَ من قبل، حقق هذا الإعداد متوسط دقة مطلقة - مقياس إجمالي لجودة الكشف - بنحو 86.8 بالمئة، مع سرعة تشغيل تقارب 33 إطاراً في الثانية، وهي كافية تقريباً للمراقبة الزمن-الحقيقي. بالمقارنة مع أنظمة المراقبة التقليدية المشروطة، حسّن النموذج المتكيِّف الدقة بما يصل إلى 14 نقطة مئوية، وبما يصل إلى 39 نقطة مقابل خط أساس أبسط.

ما الذي يعنيه هذا لمواقع أكثر أماناً

لغير المتخصصين، الخلاصة أن تدريباً أذكى، وليس مجرد مجموعات بيانات أكبر، يمكن أن يجعل المراقبة الآلية للسلامة أكثر اعتمادية. من خلال التعلم من كل من الصور اليومية ومواقع العمل الحقيقية، وتعليم النظام تجاهل تفاصيل الخلفية غير المهمة، يكتشف النهج المقترح خوذاً وسترات وقفازات وأقنعة وأحذية سلامة مفقودة بدرجة عالية من الموثوقية، حتى عندما تكون المخالفات الحقيقية نادرة. بينما يركز العمل الحالي على خمسة أنواع من المعدات ومجموعة بيانات إنشائية رئيسية واحدة، فإنه يقدم مخططاً عملياً لأنظمة مستقبلية قد تتعقّب أيضاً أحزمة الأمان، والحبال، ومعدات سلامة أخرى عبر مواقع عديدة، مما يساعد المشرفين على كشف المشكلات مبكراً وحماية العمال دون الحاجة لمراقبة الفيديو طوال اليوم.

الاستشهاد: Wang, S. Domain-adaptive faster R-CNN for non-PPE identification on construction sites from body-worn and general images. Sci Rep 16, 4793 (2026). https://doi.org/10.1038/s41598-026-35148-7

الكلمات المفتاحية: سلامة البناء, معدات الحماية الشخصية, رؤية حاسوبية, تكيُّف النطاق, كشف الأجسام