Clear Sky Science · ar

YOLO-Starfish: اكتشاف الأسماك باستخدام تعلم ميزات تحت الماء المعقدة

· العودة إلى الفهرس

لماذا من الصعب اكتشاف الأسماك تحت الماء

من تغيّر المناخ إلى الصيد الجائر، فهم ما يحدث أسفل سطح الماء أمر بالغ الأهمية. يعتمد العلماء ومديرو مصايد الأسماك بشكل متزايد على الكاميرات تحت الماء لعدّ وتحديد الأسماك، لكن الصور التي يجمعونها غالباً ما تكون عكرة ومائلة إلى الأزرق‑الأخضر ومليئة بالحيوانات المتداخلة. مراجعة آلاف الساعات من الفيديو يدوياً بطيئة ومعرضة للأخطاء. تقدم هذه الورقة YOLO‑Starfish، نظام ذكاء اصطناعي مدمج مصمم لمساعدة الروبوتات والكاميرات تحت الماء على العثور على الأسماك تلقائياً في هذه الظروف الصعبة، إلى جانب مجموعة صور جديدة ومفصّلة للأسماك العذبة.

Figure 1
شكل 1.

العالم تحت الماء بعيون الكاميرا

اكتشاف الأجسام تحت الماء ليس مجرد تحليل صورة عادي مع القليل من الماء المضاف. يتصرف الضوء بشكل مختلف تماماً في الأنهار والبحيرات: تختفي الأطوال الموجية الحمراء بسرعة، وتشتت الجسيمات الضوء في عدة اتجاهات، ويمكن أن تتغير الرؤية من واضحة إلى غائمة داخل أمتار قليلة. تضيف الأسماك نفسها طبقة إضافية من الصعوبة. قد تبدو أنواع مختلفة متشابهة جداً، وقد يتراوح حجم أفراد النوع الواحد من صغار دقيقة إلى بالغة كبيرة، وغالباً ما تتداخل أو تختبئ بين النباتات أو تسبح داخل الظلال وخارجها. العديد من نهج الذكاء الاصطناعي الحالية تدربت على صور نظيفة ومضاءة جيداً ونادراً ما ترى مشاهد فوضوية كهذه، لذا تُواجه صعوبات عند نشرها في الطبيعة.

بناء مجموعة صور سمكية واقعية

لمعالجة هذه الفجوة، جمع المؤلفون أولاً مجموعة بيانات الأسماك العذبة تحت الماء (UFFD)، وهي مجموعة كبيرة من الصور الحقيقية تحت الماء. جمعوا مقاطع فيديو عامة من مواطن مائية عذبة متنوعة، واستخلاصوا الإطارات آلياً على فترات منتظمة، ثم اختاروا ووسموا بعناية الصور عالية الجودة. بدلاً من التركيز على عدد قليل من أنواع الشبوط الشهيرة، قرروا وسم كل سمكة يمكن التعرف عليها، لينتهوا إلى 19 فئة، بما في ذلك فئة "سمكة غير معروفة" للأفراد التي لا يمكن تحديدها بثقة. تحتوي المجموعة النهائية على 18,594 صورة (16,904 فريدة)، تغطي طيفاً واسعاً من صفاء الماء، وظروف الإضاءة، ومسافات الكاميرا، وأحجام الأسماك. والأهم أن توزيع الأنواع يتبع نمطاً "ذو ذيل طويل": بعض الأنواع شائعة، بينما كثير منها نادر — تماماً كما في النظم البيئية الحقيقية.

Figure 2
شكل 2.

طريقة أذكى لقراءة الصور المتدهورة

استناداً إلى هذه المجموعة، بنى الفريق YOLO‑Starfish، نسخة محسنة من كاشف الوقت الحقيقي الشهير YOLOv8. يدفع فكرتان رئيسيتان هذا الترقية. أولاً، يغيّر مُكوّن C2Star طريقة دمج الشبكة للميزات الداخلية. بدلاً من جمع الأنماط ببساطة، يقوم بضربها عنصراً بعنصر بعملية تُسمى "العملية النجمية". هذا يحاكي كيف يضعف الضوء فعلياً أثناء مروره في الماء، حيث تُقاس الإشارات بدلاً من أن تُدفن في الضوضاء. رياضياً، يسمح هذا الضرب للشبكة بتمثيل تراكيب أكثر تعقيداً من الأشكال والألوان دون أن تصبح ثقيلة، وهو أمر حيوي للروبوتات تحت الماء التي تعمل بالبطارية ولها قدرة حسابية محدودة.

ترك الشبكة تقرر ما هو المهم فعلاً

الابتكار الثاني، وحدة التعزيز المدفوعة بالانتباه (ADEM)، يركز على أي المعلومات موثوقة في كل صورة. بما أن الماء غالباً ما يزيل بعض قنوات الألوان — خاصة الحمراء — فإن الممارسة الشائعة بمعاملة كل لون على قدم المساواة يمكن أن تضلّل الكاشف. تقوم ADEM بضغط معلومات قنوات الألوان كلها إلى قيمة توجهية واحدة تقدّر مدى موثوقية تلك القنوات بشكل عام. ثم تجمع هذه الإشارة العامة مع انتباه مكاني يبرز مناطق محددة في الصورة، مستخدمة قاعدة بسيطة "اختر الحد الأقصى" بدل الجمع المباشر. في المشاهد التي تكون فيها إشارات اللون قوية، يعتمد النموذج أكثر على معلومات القنوات؛ وعندما تكون الألوان مستنفدة، يعتمد أكثر على الأنماط المكانية مثل الأشكال والحواف. تُستخدم خريطة الانتباه الناتجة في النهاية لتعزيز أو كبح الميزات عبر الصورة بطريقة مرنة ومُستندة إلى البيانات.

ما مدى كفاءة YOLO‑Starfish؟

اختبر المؤلفون YOLO‑Starfish على ثلاثة معايير مرجعية: مجموعة UFFD الجديدة، ومجموعة بيانات مائية موجودة (RUOD)، ومجموعة COCO2017 العامة واسعة الاستخدام. في الثلاثة جميعها، أدى إضافة C2Star وADEM إلى تحسين درجات الاكتشاف على أساس YOLOv8، وفي كثير من الأحيان بعدة نقاط مئوية، مع تقليص طفيف في عدد معلمات النموذج والحساب. كانت المكاسب ملحوظة خصوصاً في الحالات الصعبة في UFFD، مثل الأنواع النادرة ذات العينات التدريبية القليلة وفئة "السمكة غير المعروفة" الجامِعة، مما يشير إلى تعميم أفضل للمظاهر الجديدة أو المبهمة. على COCO2017، حافظ YOLO‑Starfish أيضاً على أداء منافس أمام نماذج صغيرة متقدمة أخرى، مما يدل على أن التحسينات مفيدة على نطاق واسع وليست مقتصرة على صور تحت الماء.

ماذا يعني هذا لمراقبة المياه

بالمجمل، تظهر الدراسة أن تصميم ذكاء اصطناعي مدروس يمكن أن يجسر الفجوة بين الصور المختبرية النظيفة والعالم الفوضوي المشوه ألوانه تحت السطح. من خلال إقران مجموعة بيانات سمكية عذبة واقعية مع معالجة ميزات مُستلهمة من الفيزياء (C2Star) وانتباه تكيفي (ADEM)، يقدم YOLO‑Starfish اكتشاف أسماك أدق دون الحاجة إلى أجهزة ثقيلة. بالنسبة للإيكولوجيين، ومديري المصايد، وروبوتيي المراقبة، يمكن لأداة من هذا النوع أن تجعل المراقبة طويلة المدى وعلى نطاق واسع للحياة المائية أكثر عملية، مقدمة رؤية أوتوماتيكية أوضح للنُظم البيئية المائية وكيفية تغييرها مع الزمن.

الاستشهاد: Gong, R., Xu, J., Zheng, Z. et al. YOLO-Starfish: fish object detection learning complex underwater features. Sci Rep 16, 13964 (2026). https://doi.org/10.1038/s41598-026-44187-z

الكلمات المفتاحية: اكتشاف الأسماك تحت الماء, رؤية الحاسوب, التعلّم العميق, علم البيئة المائية, المراقبة الروبوتية