Clear Sky Science · ar
نموذج كشف أشياء متعدد المقاييس يعتمد على محول الرؤية الهرمي
لماذا تهم الشقوق الدقيقة
من الجسور والأنفاق إلى أبراج الشقق السكنية، تُبنى العديد من المنشآت الحديثة من الخرسانة. يمكن أن تتطور الشقوق الدقيقة أو العيوب المخفية في تلك الخرسانة إلى حفر أرضية أو سقوط حطام أو حتى انهيار. لا يزال المفتشون يعتمدون بدرجة كبيرة على البصر البشري، وهو بطيء ومكلِّف وقد يغفل عيوبًا صغيرة لكنها خطرة. تقدم هذه الورقة نظامًا جديدًا للذكاء الاصطناعي مصممًا لاكتشاف عيوب الخرسانة بأحجام مختلفة بدقة أكبر، مما يساعد على جعل المباني والبنية التحتية أكثر أمانًا.
رصد العيوب عبر مقاييس متعددة
التحدي الأساسي هو أن العيوب لا تظهر بحجم واحد مناسب. الشق العريض يسهل على الكاميرات والخوارزميات رصده، لكن الشق الرفيع جدًا أو بقعة الصدأ قد تكون بنفس الأهمية وأكثر صعوبة في الاكتشاف. تعمل أنظمة كشف الأشياء التقليدية، مثل الإصدارات الأقدم من سلسلة نماذج YOLO الشهيرة، بشكل جيد للأجسام الكبيرة والواضحة لكنها غالبًا ما تكافح مع الأجسام الصغيرة أو المتداخلة أو الخافتة. وهذا يمثل خطرًا خاصًا في البناء والتصنيع والرعاية الصحية، حيث قد يؤثر غياب اكتشاف خلل على سلامة البشر. يهدف المؤلفون إلى بناء كاشف يمكنه رؤية المشكلات الكبيرة والصغيرة داخل صورة واحدة، دون أن يصبح بطيئًا جدًا للاستخدام الميداني. 
دمج الرؤية السريعة مع هرم ذكي
للقيام بذلك، يجمع الباحثون بين فكرتين قويتين. يحتفظون بوحدة "رأس الكشف" الخاصة بـ YOLOv12 الأحدث، وهي جيدة في تحويل الميزات البصرية إلى إطارات محددة حول الأشياء، ويستبدلون العمود الفقري التقليدي لها بمحور محول الرؤية الهرمي. بدلًا من مسح أحياء بيكسل صغيرة فقط، ينظر هذا المحول إلى الصورة بأكملها ويتعلم كيف ترتبط المناطق البعيدة بعضها ببعض عبر عملية تسمى الانتباه الذاتي. وفي الوقت نفسه، يبني هرمًا من خرائط الميزات عند دقات مختلفة — من نظرات عامة خشنة إلى تفاصيل دقيقة — بحيث يمكن تمثيل الشقوق الصغيرة والبقع الكبيرة من الضرر معًا. تُغذى خرائط الميزات متعددة المقاييس هذه بعد ذلك إلى YOLOv12، الذي يقرر مكان و نوع العيوب.
تنقية وإثراء صور التدريب
نموذج ذكي يحتاج إلى بيانات تدريب ذكية بالمثل. صور الخرسانة الواقعية فوضوية، بها ظلال وإضاءة غير متساوية وملمس خشن قد يخفي العيوب. صمّم المؤلفون خط معالجة مسبق مكونًا من ثماني خطوات لاستخراج "أقنعة" واضحة للعيوب من الصور الخام. يحولون الصور إلى تدرج رمادي، يزيلون الضوضاء، يعززون التباين محليًا لكشف الشقوق الخافتة، يعكسون السطوع لتبرز العيوب، ويستخدمون عمليات مرتكزة على الشكل لربط شظايا الشق المكسورة وإزالة النُقَيط الصغيرة التي ليست أضرارًا حقيقية. النتيجة هي محيط نظيف لكل عيب.
إنشاء عيوب تركيبية واقعية
لأن العيوب الخطرة أقل شيوعًا من الأسطح السليمة، تكون بيانات التدريب غير متوازنة: قد يتعلم النموذج خلاف ذلك أن "لا عيب" هو الخيار الآمن. لإصلاح ذلك، يبني الفريق مكتبة من أقنعة العيوب المعزولة ويلصقها على خلفيات خرسانية نظيفة في مواقع وزوايا وأحجام عشوائية عديدة. بدلًا من الاقتصار على القص واللصق، يستخدمون دمجًا ناعمًا حتى تندمج حواف العيب طبيعيًا مع السطح الجديد. ينتج عن ذلك صورًا تركيبية واقعية تحافظ على مظهر الشقوق والصدأ والتقشر وأنواع الأضرار الأخرى، بينما تزيد بشكل كبير من تنوّع الأمثلة التي يرىها النموذج أثناء التدريب. 
ما مدى فعالية النظام؟
يقارن المؤلفون نظامهم المكوّن من المحول الهرمي مع YOLO وعدّة عائلات من الكاشفات الأخرى، بما في ذلك إصدارات YOLO الأقدم، والنماذج الكلاسيكية ذات المرحلتين مثل Faster R-CNN، والتصميمات الحديثة المعتمدة على المحولات مثل DETR وDINO. يحسّن نموذجهم بشكل متكرر كشف العيوب الصغيرة، حيث تكون مخاطر السلامة الأعلى، ويتنافس جيدًا على العيوب متوسطة وكبيرة الحجم. كما يتفوّق أيضًا على تصميم ذي محول مختلف (Swin) كعمود فقري، مع عدد معلمات أقل وحساب طفيفًا أقل. على الرغم من أن العمود الفقري المعتمد على المحول يجعل كل تنبؤ أبطأ من أخف إصدارات YOLO، فإن الزيادة في الدقة — لا سيما على العيوب الدقيقة ضمن نسيج خرسانية صاخب — كبيرة وملموسة.
هياكل أكثر أمانًا بعيون رقمية أكثر حدة
عمليًا، تُظهر هذه الدراسة أن إقران محول الرؤية الهرمي بكاشف حديث مثل YOLO يمكن أن يجعل الذكاء الاصطناعي أفضل بكثير في اكتشاف العيوب الدقيقة دون إغراق المهندسين بإنذارات كاذبة. يحول النموذج صور التفتيش الخام والمكتظة إلى تمثيلات متعددة المقاييس ومستنيرة عالميًا تبرز الشقوق والصدأ والتقشر عبر نطاقات أحجام مختلفة. مع تحسين إعداد البيانات وصور التدريب التركيبية، يتعلم التمييز بين العيوب الحقيقية والأنماط السطحية غير الضارة. وبينما لا يزال هناك مقايضة بين السرعة والدقة، تقرّب هذه المقاربة التفتيش الآلي من الاستخدام الموثوق في العالم الحقيقي — مقدمة مجموعة أعين رقمية أكثر حدة للمساعدة في منع إخفاقات مكلفة وخطيرة في بيئتنا المبنية.
الاستشهاد: Baek, JW., Suh, D. & Chung, K. Multiscale object detection model based on pyramid vision transformer. Sci Rep 16, 13307 (2026). https://doi.org/10.1038/s41598-026-43522-8
الكلمات المفتاحية: كشف عيوب الخرسانة, محول الرؤية الهرمي, كشف الأشياء YOLO, رؤية متعددة المقاييس, سلامة البنية التحتية