Clear Sky Science · ar

بحث في إعادة بناء الصور عالية الدقة لمواقع البناء استنادًا إلى آلية الانتباه والشبكات التنافسية التوليدية

· العودة إلى الفهرس

عيون أوضح على مواقع البناء المزدحمة

تملأ مواقع البناء الحديثة بالكاميرات والطائرات بدون طيار وأجهزة الاستشعار، لكن العديد من الصور التي تلتقطها تكون مخيبة للآمال بسبب الضبابية أو قلة التفاصيل، خاصة على مسافات بعيدة أو في ظروف إضاءة ضعيفة. يقدم هذا البحث طريقة جديدة لتحويل تلك الصور الخام إلى مشاهد حادة وعالية الدقة بسرعة كافية للمراقبة الحية، مما يساعد المهندسين ومديري السلامة على رؤية تفاصيل صغيرة لكنها مهمة مثل الخوذ، والشقوق، أو المواد المتساقطة التي قد تُفوت في غير ذلك.

لماذا تشكل الصور الضبابية مشكلة حقيقية

في موقع البناء، يمكن لتغذية كاميرا واحدة أن تدعم مهامًا متعددة في آن واحد: التحقق من ارتداء العاملين للخوذ، تتبع حركة الأشخاص والآلات، رصد الشقوق أو الأجزاء المفكوكة، وقياس التقدّم. ومع ذلك، في الواقع، تقف الكاميرات بعيدًا عن موقع الحدث، أو تهتز بفعل الرياح، أو تعمل ليلًا تحت أضواء قوية. النتيجة غالبًا صور حبيبية ومنخفضة الدقة تختفي فيها التفاصيل الصغيرة لكن الحرجة. يمكن لأساليب تحسين الصور الحالية أن تُحسّن هذه المشاهد، لكنها تميل إلى مواجهة مفاضلة: فبعضها سريع لكنه يترك الصور مشبعة أو مصطنعة؛ وأخرى تخلق صورًا حادة لكنها بطيئة جدًا لتشغيل الفيديو في الوقت الفعلي، خصوصًا في مشاهد مزدحمة ومعقدة مليئة بالسقالات والرافعات والأجسام المتداخلة.

Figure 1
Figure 1.

طريقة أذكى لاستعادة التفاصيل

يصمم المؤلفون نظامًا جديدًا لتحسين الصور يقع بين الكاميرا وتطبيقات المراقبة. يعتمد على فئة من نماذج الذكاء الاصطناعي تُسمى الشبكات التنافسية التوليدية، حيث تحاول شبكة إنشاء صور عالية الدقة واقعية بينما تحاول شبكة أخرى تمييز الصور الحقيقية من المزيفة. من خلال هذا التنافس، تتعلّم شبكة المُولّد إضافة تفاصيل تبدو حقيقية بدلًا من مجرد تنعيم الحواف الخشنة. ولمعالجة مشاهد البناء بشكل أفضل، ينظر النموذج أولًا إلى كل صورة ضبابية بعدة مقاييس في وقت واحد، مستخدمًا فلاتر بأحجام مختلفة لالتقاط التخطيطات العامة، مثل مخطط رافعة البرج، والعناصر الدقيقة، مثل قضبان سياج الحماية. يضمن هذا «الواجهة متعددة المقاييس» ألا تُفقد الأجسام الصغيرة عندما يبدأ النظام بمعالجته الأعمق.

التركيز على ما يهم أكثر

داخل جوهر النموذج، يقدم المؤلفون لبنة جديدة تتعامل مع أنواع مختلفة من المعلومات البصرية بطرق مختلفة. تُفصل المناطق الملساء مثل السماء والجدران أو أسطح الطرق عن الهياكل الحادة مثل مفاصل السقالات وحواف الكابلات وأنماط الشقوق. يعالج النظام هذين المسارين بدقات مختلفة، موفّرًا الجهد على المناطق البسيطة ومكرّسًا مزيدًا من قدرة الحوسبة للتفاصيل الدقيقة. وفي الوقت نفسه، تتعلّم آلية الانتباه تمييز أكثر أجزاء المشهد إفادة—الأماكن التي تظهر فيها هياكل مهمة أو عناصر مرتبطة بالسلامة—بينما تقلل من شأن الفوضى الخلفية المكرّرة. ومكوّن آخر يعدّل المعالجة بشكل دقيق استنادًا إلى دلائل سابقة من الصورة، بحيث يمكن أن تتلقى المناطق التي تحتوي على عمال أو مواد أو معدات معالجة مخصّصة تحافظ على أشكالها وملمسها المميّز.

الحكم على الواقعية بواسطة ناقد جديد

لتحديد ما إذا كانت الصور المحسّنة تبدو فعلاً كصور عالية الدقة حقيقية، يستخدم النظام شبكة «ناقد» حديثة تفحص كلًا من الرقع المحلية الصغيرة وترتيب المشهد الأوسع. بني هذا الناقد من بنية محوّلة (Transformer) طُورت في الأصل لمهام الرؤية، والتي تقسم الصور إلى رقع وتدرس كيف ترتبط هذه الرقع بعضها ببعض عبر الإطار. أثناء التدريب، يحاول المولّد خداع هذا الناقد، بينما يواصل الناقد رفع معاييره. بالإضافة إلى اختبار الواقعية هذا، يتضمن عملية التدريب أيضًا مقاييس تشجّع على إعادة بناء دقيقة على مستوى البكسل وتشابه مع كيفية إدراك البشر لجودة الصورة، مما يحقق توازنًا بين الحواف الحادة والملمس الطبيعي والبنية العامة المخلصة.

Figure 2
Figure 2.

مُختبَرة على مشاهد بناء حقيقية

درّب الباحثون وجرّبوا طريقتهم على مجموعة بيانات عامة كبيرة لمواقع بناء حقيقية، تضم عشرات الآلاف من الصور عالية الجودة التي تغطي العمال والآلات والمواد وتخطيطات المواقع تحت ظروف جوية وإضاءة مختلفة. شوهوا هذه الصور صناعيًا وجعلوها منخفضة الدقة لإنشاء مدخلات منخفضة الجودة، ثم طلبوا من النموذج إعادة بناء النسخ الأصلية بدقة تزيد بأربع مرات. بالمقارنة مع عدة تقنيات تحسين رائدة، أنتج النهج الجديد نصوصًا أوضح على اللافتات، ونسيج خشب أكثر طبيعية، وخطافات رافعات أكثر حدة، وحواف هيكلية أفضل، حتى في المشاهد المظلمة أو المزعجة. كما عمّم النموذج جيدًا على أنواع أخرى من الصور، مثل المشاهد الطبيعية والمباني الحضرية، مما يشير إلى أن التصميم مفيد على نطاق أوسع من البناء وحده.

صور أوضح، مواقع أكثر أمانًا

من الناحية العملية، النتيجة الأكثر بروزًا هي أن هذا النظام يحقق جودة بصرية عالية وسرعة في الوقت الحقيقي معًا: فهو قادر على معالجة الفيديو بحوالي 32 إطارًا في الثانية على بطاقة رسومية شائعة، وهو ما يكفي للمراقبة الحية. هذا يعني أن إعدادات الكاميرا الحالية في مواقع البناء قد تكتسب، من حيث المبدأ، «تكبيرًا» افتراضيًا يكشف تفاصيل صغيرة دون تغيير العتاد. يمكن أن تغذي الصور أوضح أدوات لاحقة للكشف عن الخوذ أو فحص الشقوق أو تحليل السلوك، مما يجعل الإشراف الآلي أكثر موثوقية. ببساطة، يُظهر البحث كيف نمنح المراقبين الرقميين في مواقع البناء عيونًا أكثر حدة—ترى أكثر، أسرع، وفي ظروف أصعب—دون إبطاء تدفق المعلومات.

الاستشهاد: Chen, Q., Hou, G., Wang, D. et al. Research on super-resolution reconstruction of construction images based on attention mechanism and generative adversarial networks. Sci Rep 16, 9449 (2026). https://doi.org/10.1038/s41598-026-40613-4

الكلمات المفتاحية: زيادة دقة الصورة, مراقبة مواقع البناء, رؤية الحاسوب, الشبكات التنافسية التوليدية, فحص السلامة