Clear Sky Science · ar

محولات الرؤية - نموذج تصنيف الشقوق السطحية المدفوع بالمستهلك والمبني على شبكات كولموغوروف–أرنولد

2026-02-15 · العودة إلى الفهرس

لماذا تهم الشقوق في الهياكل اليومية

قد تبدأ الشقوق في الطرق والجسور وجدران المباني كشروخ دقيقة، لكنها يمكن أن تتطور إلى مخاطر أمان خطيرة وتكاليف إصلاح باهظة. اليوم، ما تزال معظم عمليات فحص الشقوق تعتمد على أشخاص يتجولون حاملين لوائح أو كاميرات، ما يجعل العملية بطيئة ومكلفة ومعرضة للخطأ—خاصة بالنسبة للعيوب الصغيرة أو المخفية. تقدم هذه الورقة طريقة حاسوبية جديدة تكتشف وتصنف الشقوق السطحية في الخرسانة والأسفلت بدقة عالية جدًا، مع كفاءة تكفي لتشغيلها على الهواتف والطائرات بدون طيار أو أجهزة صغيرة أخرى. هذا يفتح الباب أمام مراقبة روتينية ومنخفضة التكلفة للهياكل التي نستخدمها يوميًا.

من الفحص اليدوي إلى الكاميرات الذكية

لفحص الأسطح بالعين عيوب واضحة: فهو ذو طابع شخصي، ويستغرق وقتًا طويلاً، وقد يكون خطيرًا أحيانًا للمفتشين العاملين على طرق مزدحمة أو جسور مرتفعة. حاولت برامج الكمبيوتر السابقة اكتشاف الشقوق في الصور باستخدام حيل بسيطة مثل كشف الحواف والعتبات، لكنها واجهت صعوبات مع الظلال والإضاءة المتغيرة أو الأسطح الخشنة التي قد تبدو كشقوق. تستخدم الأنظمة الأحدث التعلم الآلي، حيث تتعلم الخوارزميات الأنماط من العديد من الصور. دفعت الشبكات العصبية الالتفافية ومحوّلات الرؤية الحديثة الدقة إلى مستويات أعلى، ومع ذلك ما تزال معظمها تواجه صعوبة في التعامل مع الشقوق الرقيقة وغير المنتظمة في ظروف العالم الحقيقي ونادرًا ما تشرح كيف توصلت إلى قراراتها.

نموذج ذكي هجيني يرى بوضوح أكبر

صمم المؤلفون نموذج تعلم عميق هجيني يجمع عدة نقاط قوة في خط معالجة واحد. أولًا، تنظر شبكة مدمجة تُدعى MobileNet V3 إلى الصورة وتستخرج التفاصيل المحلية مثل الحواف، والشقوق الدقيقة، والملمس. بعد ذلك، يحلل نموذج محول يُدعى LeViT كيف ترتبط أجزاء الصورة ببعضها البعض، ملتقطًا أنماطًا طويلة المدى—مثل كيف يلتف شق رفيع عبر لوح. المكوّن الثالث، محول Linformer محسن، يركز على نمذجة هذه العلاقات بعيدة المدى بكفاءة حتى في الصور عالية الدقة، لكنه يقلل الحسابات، مما يجعله عمليًا للأجهزة الصغيرة.

مزج الإشارات واتخاذ القرار النهائي

بدلًا من تكديس هذه المكوّنات ببساطة، يستخدم النظام خطوة «اندماج السمات المقنّنة» التي تتعلم أي قطع المعلومات من كل شبكة هي المهمة بالفعل وأيها زائدة عن الحاجة. يساعد ذلك النموذج على الاحتفاظ بالدلائل المفيدة حول عرض الشق وطوله واستمراريته مع تجاهل الأنماط الخلفية المشتتة. تُمرَّر الإشارة المدمجة بعد ذلك إلى شبكة كولموغوروف–أرنولد، وهي نوع خاص من الشبكات العصبية يمثل العلاقات المعقدة باستخدام منحنيات رياضية مرنة. تم ضبط هذا المصنّف لرسم حدود حادة بين حالات «شق» و«لا شق»، حتى عندما تكون الأنماط في البيانات رقيقة أو فوضوية، مع البقاء سريعًا ومضغوطًا بما يكفي للاستخدام في الوقت الفعلي على أجهزة الحافة مثل الهواتف الذكية أو اللوحات المدمجة.

فتح الصندوق الأسود للذكاء الاصطناعي

لأن سلامة البنية التحتية تعتمد على الثقة، ركّز المؤلفون أيضًا على جعل قرارات النموذج قابلة للفهم. طبقوا أداتين للتفسير—SHAP وLIME—لتسليط الضوء على مناطق الصورة والميزات التي أثّرت أكثر على التنبؤ المعطى. عندما يكتشف النموذج شقًا، تبرز هذه الأدوات عادة مسار الشق وما يحيط به مباشرة، مما يؤكد أن النظام «ينظر» إلى الأماكن الصحيحة بدل أن يخدعها البقع أو الظلال. خلال التطوير، كشفت هذه التفسيرات أيضًا عن نقاط ضعف، مثل ميل النموذج للرد على خطوط الطلاء على الأسفلت، وهو ما دفع الفريق إلى تعديل عملية التدريب لتقليل الإنذارات الكاذبة.

مدى فاعليته ولماذا يهم

عند اختباره على مجموعات كبيرة ومتنوعة من صور الخرسانة والأسفلت—أكثر من 40,000 صورة من مجموعات بيانات عامة متعددة—وصل النموذج إلى نحو 99.5% دقة وحافظ على أداء قوي حتى على صور جديدة لم يرها من قبل. كما عمل بحسابات وذاكرة أقل من العديد من الأساليب المنافسة، مما يجعله مناسبًا للاندماج في الإلكترونيات الاستهلاكية والطائرات بدون طيار وأنظمة التفتيش منخفضة التكلفة. هذا يعني أن أصحاب المنازل، ومديري المنشآت، ومهندسي المدن قد يتمكنون يومًا ما من استخدام كاميرات ذكية عادية أو تطبيقات جوال لمراقبة الأسطح باستمرار والإبلاغ عن تكوّن الشقوق المبكرة، محولين رعاية الهياكل من حدث يدوي نادر إلى إجراء روتيني قائم على البيانات.

التطلّع إلى هياكل أكثر أمانًا

بعبارات بسيطة، تُظهر الدراسة أن مزيجًا مصممًا بعناية من الشبكات خفيفة الوزن، والمحوّلات الفعالة، ومصنّف متقدّم يمكنه بموثوقية التمييز بين الأسطح المتشققة والسليمة مع توضيح سبب الوصول إلى ذلك الحكم. لا تزال هناك تحديات مفتوحة—مثل التعامل مع الإضاءة القصوى أو قدرات الأجهزة المحدودة جدًا—لكن العمل يشير إلى مستقبل تُراقَب فيه المباني والجسور والأرصفة تلقائيًا، مما يساعد على منع تحول العيوب الصغيرة إلى فشلات خطيرة.

الاستشهاد: Wahab Sait, A.R., Sankaranarayanan, S. & Yu, Y. Vision transformers- Kolmogorov–Arnold networks-based consumer driven surface cracks classification model. Sci Rep 16, 9183 (2026). https://doi.org/10.1038/s41598-026-40359-z

الكلمات المفتاحية: مراقبة البنية التحتية, شقوق الخرسانة, رصف الأسفلت, التعلّم العميق, رؤية الحاسوب