Clear Sky Science · ar

YOLO-MFD: إطار ميزات متعددة القياسات ورأس ديناميكي لاكتشاف الأجسام تحت الماء على الشواطئ المسبق تصنيعها

· العودة إلى الفهرس

عيون أذكى تحت شواطئ المدن

مع بناء المدن المزيد من الجدران والأرصفة والكسوات المسبقة على طول الأنهار والبحيرات، ينتهي الحال بالعديد من البنى التحتية الحيوية مخفية تحت الماء. التحقق من ثبات هذه الكتل أو وجود تشققات أو وجود حطام فيها أمر صعب، لا سيما في المياه العكرة والضحلة حيث تكون الرؤية ضعيفة. يقدم هذا البحث YOLO-MFD، نظام رؤية حاسوبية جديد يساعد الروبوتات تحت الماء على رصد الأجسام الصغيرة والخافتة على طول الشواطئ بمزيد من الاعتمادية والسرعة، حتى عندما تكون المياه عكرة والمشهد مزدحمًا.

لماذا يصعب قراءة صور تحت الماء

نادراً ما تكون مياه الأنهار والبحيرات ومياه الشاطئ الحضرية صافية كالكريستال. يمتص الضوء ويتشتت، وتتجه الألوان نحو الأخضر أو الأزرق، وتطمس الجسيمات المعلقة الحواف. الكائنات الصغيرة، أو النفايات البحرية، أو العيوب في كتل الشاطئ المسبقة يمكن أن تكون ضئيلة التباين وكثيفة التكتل. تميل نظم كشف الأجسام التقليدية، المصممة أصلاً لمشاهد الشوارع الواضحة، إلى تفويت هذه الأهداف أو خلطها مع ضوضاء الخلفية. في الوقت نفسه، تمتلك روبوتات الفحص والأجهزة المدمجة المستخدمة قرب الشواطئ قدرات حاسوبية محدودة، لذلك يجب أن يكون أي حل دقيقًا وفعالًا في آن واحد.

عقل مكوَّن من ثلاث مراحل للمياه العكرة

يبني YOLO-MFD على عائلة YOLO الشهيرة للكاشفات الزمن الحقيقي لكنه يعيد تشكيل «عقله» الداخلي عبر ثلاث مراحل منسقة. أولاً، العمود الفقري الجديد المسمى CUMANet (شبكة الانتباه الموحدة متعددة القياسات عبر النطاق) يتعلم استخراج الميزات من الصور مع إيلاء انتباه للسياق الأوسع. يستخدم فروعًا متوازية وعمليات التفاف متخصصة تتصرف مثل وحدة متعددة الفروع أثناء التدريب لكنها تبسط إلى عملية واحدة فعّالة أثناء النشر. يساعد ذلك الشبكة على النظر أبعد من الضوضاء المحلية، واحتواء الإشارات بعيدة المدى، والحفاظ على تفاصيل مهمة من أن تُمحى بسبب العكارة وتشوهات الألوان.

Figure 1
شكل 1.

متابعة الدلائل الدقيقة على مقاييس مختلفة

تتعامل المرحلة الثانية، تعديل الميزات التكيفي (AFM)، مع نقطة ضعف شائعة في أنظمة الرؤية: عند دمج المعلومات من دقة خشنة وناعمة، غالبًا ما تُغرق التفاصيل صغيرة المقياس. يجمع AFM خريطتي ميزات عبر مواءمة أحجامهما وقنواتهما أولاً، ثم حساب بوابات لطيفة ومستقلة لكل فرع. بدلًا من إجبار مقياس واحد على السيطرة، يسمح AFM لكليهما بالمساهمة متى حملت إشارة مفيدة، ويضيف اختصارًا بقايا لتجنب فقدان الأنماط الضعيفة لكنها مهمة. هذا الدمج المتوازن متعدّد المقاييس مفيد بصورة خاصة لرصد خيار البحر الصغير، أو نجوم البحر، أو تشققات الخرسانة التي تكاد لا تبرز عن الخلفية.

صانع قرار نهائي أكثر مرونة

تعمل المرحلة الأخيرة، DPNDyHead (الرأس الديناميكي المعياري ثنائي التجميع)، على تحسين الميزات فورًا قبل أن يقرر النظام ما هي الأجسام وأين تقع. يستعير الفكرة من الالتفافات القابلة للتشوه، التي تحول نقاط أخذ العينات لتتبع الأشكال الضبابية أو المشوهة تحت الماء بشكل أفضل. للتعامل مع الأجسام ذات الأحجام المتفاوتة جدًا، يستخدم DPNDyHead كلًا من التجميع المتوسط والحد الأقصى عبر المقاييس، جامعًا السياق العام مع الاستجابات المحلية الحادة مثل الحواف أو النسيج. خطوة التطبيع تثبت إحصاءات الميزات قبل توليد التفعيلات الخاصة بالمهمة، مما يقلل تأثير تغيرات الألوان والإضاءة غير المتساوية. تساعد هذه الحيل مجتمعة على موائمة ثقة التصنيف (ما هو الشيء) مع دقة التحديد المكاني (أين هو).

Figure 2
شكل 2.

ما مدى فاعليته في العالم الحقيقي؟

اختبر المؤلفون YOLO-MFD على مجموعتين عامتين من بيانات تحت الماء من مزارع تربية الأحياء المائية والبحر المفتوح، والتي تتضمن العديد من الأهداف الصغيرة والمزدحمة وتدهورًا قويًا في الصور. على كل من مجموعتي DUO وUDD، تفوق الإطار الجديد على الكواشف التقليدية المكوّنة من مرحلتين، والأساليب الخالية من المرساة، والنماذج الحديثة القائمة على المحولات، وإصدارات YOLO الأخيرة. حقق دقة متوسطة واسترجاع أعلى — ما يعني أنه عثر على المزيد من الأجسام الحقيقية وارتكب أخطاء أقل — بينما استخدم فقط بضعة ملايين من المعامل وقدرة حاسوبية معتدلة. أظهرت التجارب التفصيلية أن كلًا من الوحدات الثلاث (CUMANet وAFM وDPNDyHead) أدت إلى مكاسب قابلة للقياس، وأن مزيجها أعطى أفضل توازن عام بين الدقة والمتانة والسرعة.

رؤية أوضح لشواطئ أكثر أمانًا

عمليًا، يقدم هذا العمل للروبوتات تحت الماء وأنظمة المراقبة رؤية أوضح وأكثر موثوقية لما يكمن على طول الشواطئ الحضرية وضفاف الأنهار المصممة هندسيًا. من خلال تصميم كاشف أشياء يواجه صراحة مياه العكارة، واختلال التدرج الحجمي، والتنبؤات غير المتراصفة، يوفر المؤلفون أداة يمكنها تتبع صحة البنية التحتية بشكل أفضل، ودعم المسوحات البيئية، وتوجيه إدارة ذكية لهياكل الشاطئ المسبقة الصنع. ومع استكشاف الأعمال المستقبلية لبيئات أوسع وحتى نسخ أخف من النموذج، قد تصبح طرق مثل YOLO-MFD جزءًا أساسيًا من الفحص تحت الماء الروتيني، مما يساعد على إبقاء المدن الساحلية والمجاري المائية الداخلية أكثر أمانًا وصيانةً.

الاستشهاد: Gang, Y., Li, T., Li, S. et al. YOLO-MFD: a multi-scale feature and dynamic head framework for prefabricated shoreline underwater object detection. Sci Rep 16, 10971 (2026). https://doi.org/10.1038/s41598-026-45591-1

الكلمات المفتاحية: كشف الأجسام تحت الماء, بنية الشاطئ المسبقة الصنع, رؤية حاسوبية, مركبات تحت مائية ذاتية, التعلّم العميق