Clear Sky Science · ar

تحسين اكتشاف الفئات النادرة في صور أعماق البحار عبر زيادة توليدية باستخدام ستايبل ديفيوجن

· العودة إلى الفهرس

لماذا يصعب رصد الحياة النادرة في أعماق البحار

في أعماق المحيط تحت سطح البحر بكثير، تساعد الحيوانات الكبيرة التي تعيش على قاع البحر في الحفاظ على صحة النظم البيئية العميقة. تقع هذه المخلوقات أيضاً في مسار الاهتمام المتزايد بالتعدين العميق للبحار. يرغب العلماء في أنظمة كاميرات آلية يمكنها العثور عليها وعدّها بشكل موثوق، لكن هناك مشكلة: تُرى العديد من الأنواع مرات قليلة فقط. تستكشف هذه الدراسة كيف يمكن للذكاء الاصطناعي الحديث القادر على توليد الصور أن ينشئ أمثلة إضافية واقعية للأنواع النادرة، مما يساعد برامج الكشف على أن تصبح أدق دون الحاجة لإرسال مزيد من السفن إلى البحر.

التصوير في عالم يصعب الوصول إليه

عمل الفريق مع مجموعتين كبيرتين من صور قاع البحر الملتقطة في حقل عقيدات متعددة المعادن في غرب المحيط الهادئ. جاءت إحدى المجموعات من نظام كاميرا مربوط يُسحب على ارتفاع عدة أمتار فوق القاع، والأخرى من روبوت يسبح بحرية. معاً، غطت الصور 16 نوعاً من الحيوانات، بما في ذلك خيار البحر والإسفنج والشعاب المرجانية والنجم البحري والنجم الهش والأخطبوط. مثل العديد من مجموعات بيانات الحياة البرية، كانت التوزيعات غير متكافئة بشدة: ظهرت بعض الحيوانات الشائعة كثيراً، في حين أن عدة مجموعات كان لديها أقل من 50 مثالاً مُعلّماً. وبما أن معظم الحيوانات تشغل أقل من عُشر بالمئة من كل صورة، والكاميرات مكلفة في التشغيل على أعماق تتجاوز 4000 متر، فإن جمع بيانات أكثر توازناً ليس عملياً ببساطة.

Figure 1. صور قاع بحر مولدة بالذكاء الاصطناعي توازن بين الأنواع النادرة والشائعة لتحسين اكتشاف حيوانات أعماق البحار
Figure 1. صور قاع بحر مولدة بالذكاء الاصطناعي توازن بين الأنواع النادرة والشائعة لتحسين اكتشاف حيوانات أعماق البحار

تعليم مولد الصور عن حياة قاع البحر النادرة

لمعالجة هذا الخلل، لجأ الباحثون إلى طريقة توليد الصور الشهيرة المعروفة بالنموذج الانتشاري. بدأوا من نسخة عامة قوية مدرَّبة على مشاهد يومية، ثم عدّلوها بلطف لتناسب صور أعماق البحر باستخدام طريقة ضبط خفيفة الوزن. أولاً، قَصّوا 175 مثالاً واضحاً لسبع مجموعات حيوانية نادرة، مثل البريوزوانات وبعض المرجان والأخطبوطات، واستخدموها لتدريب النموذج على رسم مقاطع أمامية مقنعة لكل نوع. تم تنويع مطالبات النص البسيطة لتشجيع تغييرات في الوضعية واللون والإضاءة وزاوية المشاهدة، حتى لا ينسخ النموذج الصور الأصلية القليلة فحسب، بل يستكشف تركيبات واقعية جديدة.

دمج الحيوانات الاصطناعية في مشاهد قاع بحر واقعية

بما أن كاشفات الكائنات تحتاج إلى كل من الحيوانات ومحيطها، ركزت المرحلة الثانية على الخلفيات والتخطيط. هنا استخدم الفريق نظام تحكم مرافق يوجّه النموذج الانتشاري باستخدام صور قناع بسيطة. حددت هذه الأقنعة أين وبأي حجم يجب أن يظهر كل حيوان اصطناعي، استناداً إلى نطاقات الأحجام المرصودة في البيانات الحقيقية. ثم أنشأ النموذج خلفيات قاع البحر بنقوش راسب وصخور وعقيدات مطابقة، ودمج المقاطع الأمامية للحيوانات بسلاسة في الموضع مع الحفاظ على اتساق الإضاءة واللون. والأهم أن كل قناع وفّر أيضاً صندوق تحديد تلقائياً، مقدمًا تسميات جاهزة. وبعد فلترة النتائج المعيبة، احتوت المجموعة الاصطناعية النهائية على 200 مثال عالي الجودة لكل فئة نادرة، تم خلطها مع صور التدريب الأصلية.

Figure 2. عملية خطوة بخطوة تُنتَج فيها حيوانات نادرة اصطناعية، وتوضع على خلفيات قاع البحر، لتعزيز دقة كاشف الكائنات
Figure 2. عملية خطوة بخطوة تُنتَج فيها حيوانات نادرة اصطناعية، وتوضع على خلفيات قاع البحر، لتعزيز دقة كاشف الكائنات

كم ساعدت الصور الإضافية؟

استُخدمت مجموعة البيانات المحسّنة لتدريب شبكة كشف حديثة تكتشف وتوسم الحيوانات في كل إطار. على كلتا مجموعتي كاميرا السحب والروبوت الحر، رفع إضافة الصور الاصطناعية درجات الدقة الرئيسية مقارنة بالتدريب على الصور الحقيقية فقط. كانت المكاسب الأكثر وضوحاً للمجموعات الأندر: على سبيل المثال، تحسّن أداء اكتشاف الأخطبوط والبريوزوانات بأكثر من 20 نقطة مئوية في إحدى المجموعات، وظهرت زيادات مماثلة للبريوزوانات والهيدروزوانات في الأخرى. كما تفوّق الأسلوب على الحيل التقليدية مثل القص العشوائي وتحويلات اللون وتركيبات القص واللصق. أظهر تحليل الأخطاء المفصل أن أكبر تحسّن جاء من تقليل الأخطاء في تمييز الأنواع عن بعضها، أكثر من تحسين دقة مواقع الصناديق المحيطة.

القيود والمقايضات والاتجاهات المستقبلية

لم تكن الفوائد متجانسة. ساعدت البيانات الاصطناعية أقل على الصور الأكثر ضبابية والأبعد من روبوت السباحة الحرة، حيث يصعب رؤية الحيوانات الحقيقية جداً. عندما اُختبرت النماذج المدربة على نظام كاميرا واحد على النظام الآخر، انخفض الأداء بشدة، مما يُظهر أن اختلافات الإضاءة والمسافة لا تزال تشكل تحدياً كبيراً. كما وجد المؤلفون أن المزيد من البيانات الاصطناعية ليس دائماً أفضل: تحسّن الأداء حتى حدّ ثم استقر، ما يشير إلى أن إضافة صور زائدة تضيف تكراراً بعد تشبع التنوع. يقترحون أبحاثاً مستقبلية على تحسين التحديد المكاني، وتعامل أفضل مع الأهداف الصغيرة والمبهمة، ونماذج توليدية أكثر كفاءة تغطي العديد من الأنواع دفعة واحدة.

ما معنى هذا لمراقبة أعماق البحار

بعبارة بسيطة، تُظهر الدراسة أن الصور المزيفة المولدة بعناية يمكن أن تجعل الأنظمة الآلية أفضل بكثير في العثور على الحيوانات النادرة في صور المسوح الحقيقية لقاع البحر. من خلال تعليم الكواشف كيف قد تبدو الأنواع غير الاعتيادية تحت ظروف واقعية متعددة، يحد هذا النهج من حالات الفقدان دون الإضرار بأداء اكتشاف الحيوانات الشائعة. وبينما لا يلغي ذلك الحاجة إلى بعثات حقيقية أو مراجعات خبراء، فإنه يقدم وسيلة عملية لتمديد قيمة البيانات المحدودة، داعماً رصداً أكثر موثوقية لمواطن أعماق البحر الهشة مع توسع النشاط الصناعي إلى مياه أعمق.

الاستشهاد: Deng, J., Duan, M., Wei, D. et al. Improving rare-class detection in deep-sea imagery via generative augmentation with stable diffusion. Sci Rep 16, 15910 (2026). https://doi.org/10.1038/s41598-026-45732-6

الكلمات المفتاحية: صور أعماق البحار, تكبير البيانات, ستايبل ديفيوجن, اكتشاف الأنواع النادرة, الروبوتات تحت الماء