Clear Sky Science · ar
شبكة دمج ميزات خفيفة الوزن لاكتشاف الأهداف الضعيفة والصغيرة في الاستشعار عن بعد
لماذا يهم العثور على أشياء صغيرة من السماء
من مراقبة حركة المرور والسفن إلى توجيه استجابات الكوارث، تقوم الأقمار الصناعية والطائرات بدون طيار اليوم بمسح سطح الأرض باستمرار. ومع ذلك، العديد من الأشياء التي نهتم بها—مثل المركبات الصغيرة والقوارب أو أجزاء البنية التحتية—تظهر في الصور على أنها تتكون من بضعة بكسلات فقط، ما يجعلها عرضة للاختفاء وسط كتل المدن المزدحمة أو الغابات أو السواحل. تقدم هذه الورقة GSS‑YOLO، نظام رؤية حاسوبية جديد وخفيف الوزن مصمم لاكتشاف هذه الأهداف الضعيفة والصغيرة في صور الاستشعار عن بعد بشكل موثوق، حتى عندما تكون الصور ضبابية أو مظلمة أو مليئة بتفاصيل خلفية مشتتة.

التحدي: إيجاد إبرة في كومة قش
تلتقط كاميرات الاستشعار عن بعد المركبة على الطائرات والأقمار الصناعية مناطق شاسعة دفعة واحدة. هذه الرؤية الواسعة مفيدة، لكنها تقلل من حجم كل كائن: فقد تغطي الأهداف الصغيرة فقط 10×10 بكسل أو أقل. في الوقت نفسه، تكون الخلفيات معقدة—الغيوم، الأسطح، الأشجار، الأنهار، الظلال، والتغيرات الموسمية في الإضاءة أو الطقس كلها تضيف ضوضاء. إما أن أنظمة الكشف التقليدية تفقد هذه الأجسام الصغيرة أو تتطلب نماذج ثقيلة وبطيئة يصعب تشغيلها في الزمن الحقيقي على الطائرات بدون طيار أو الأجهزة الحافة. هدف الباحثين كان بناء نموذج دقيق للأجسام الصغيرة وكفء بما يكفي ليعمل بسرعة على عتاد محدود.
نظام مضغوط مهيأ للتفاصيل الصغيرة
انطلق الباحثون من كاشف زمني شهير يسمى YOLOv5 وأعادوا تصميم أجزاء رئيسية لتكوين GSS‑YOLO. قدموا ثلاث وحدات بناء رئيسية تعمل معًا. أولاً، وحدة تجميع المعلومات الضحلة‑العميقة (SIA) تمزج معلومات من مناطق صغيرة ومناطق أكبر قليلًا في الصورة، مما يساعد الشبكة على دمج الحواف الدقيقة مع السياق الأوسع دون تضخيم حجم النموذج. ثانيًا، كتلة SPD‑Conv تغير طريقة تقليل حجم الصورة: بدلاً من التخلص ببساطة من البكسلات أثناء التقليل، تعيد ترتيبها بحيث تُحفظ التفاصيل الدقيقة في قنوات إضافية قبل ضغط لطيف. ثالثًا، وحدة الوعي بالسياق العالمي (GCAM) توضع قبيل الكاشف النهائي وتفحص الصورة بأكملها لتبرز المواقع المحتمل احتواؤها على أهداف صغيرة بينما تقلل من الضوضاء الخلفية.
كيف تعمل الوحدات الجديدة معًا
تعالج SIA نقطة ضعف أساسية لدى العديد من شبكات الرؤية: الالتفافات الاعتيادية ترى رقعًا محلية فقط وتكافح لفهم السياق العام. من خلال تشغيل مرشحات متوازية تنظر إلى مقاييس مختلفة قليلًا، ثم تمرير الناتج عبر طبقات خفيفة تمزج وتنظم المميزات، تنتج SIA أوصافًا أغنى للأجسام الصغيرة دون إضافة الكثير من المعاملات. تعالج SPD‑Conv مشكلة مختلفة—فقدان المعلومات بسبب التقليل العدواني. تقطع خريطة المميزات إلى شبكات فرعية متداخلة وتكدسها على عمق القنوات، بحيث لا يُتَخَلّى عن أي بكسل؛ ثم يقوم مرشح 1×1 بسيط بضغط هذا التمثيل الأكثر ثراءً. تضيف GCAM تأثير "بقعة ضوء" عالمي. تجمع معلومات بشكل منفصل على المحورين الأفقي والعمودي لتتبع الصفوف والأعمدة التي تظهر فيها الأهداف الصغيرة، وتدمج ذلك مع آلية انتباه مبسطة عبر القنوات. النتيجة قناع متعدد الأبعاد يقوّي الإشارات في المواقع المحتملة ويكبح القوامات المربكة في أماكن أخرى.

اختبار النموذج
لمعرفة ما إذا كانت هذه الأفكار تتحول إلى مكاسب عملية، قام الفريق بتقييم GSS‑YOLO على ثلاث مجموعات بيانات متطلبة. تحتوي USOD على أهداف رمادية اللون فائقة الصغر في مشاهد قليلة الإضاءة؛ تقدم VisDrone2019 مشاهد حضرية مزدحمة مصورة من طائرات بدون طيار، ومليئة بالمشاة والمركبات الصغيرة؛ وDIOR مجموعة فضائية متنوعة تضم طائرات، جسور، سفن، ملاعب رياضية والمزيد. عبر الثلاثة، حققت GSS‑YOLO باستمرار دقة واستدعاء وجودة كشف متوسطة أعلى من مجموعة من المنافسين المعاصرين، بما في ذلك إصدارات YOLO الحديثة وعدد من نماذج الأجسام الصغيرة المتخصصة. على مجموعة USOD، على سبيل المثال، لم تقدم أفضل دقة فحسب، بل فعلت ذلك بأقل عدد من المعاملات—حوالي 5 ملايين—وبأعلى سرعة معالجة، لتصل إلى مئات الإطارات في الثانية. تُظهر الأمثلة البصرية أنها تتجنب كلًا من الفشل في الكشف والإنذارات الكاذبة في مشاهد مزدحمة ومعقدة حيث تكافح الأنظمة الأخرى.
ما معنى هذا للتطبيقات اليومية
لغير المتخصصين، الرسالة الرئيسية أن GSS‑YOLO يجعل من الممكن أكثر تشغيل كشف حاد للأهداف الصغيرة والصعبة الرؤية مباشرة على الطائرات بدون طيار أو الأقمار الصناعية أو الأجهزة المدمجة الأخرى، دون الاعتماد على مراكز بيانات ضخمة. من خلال الحفاظ أفضل على تفاصيل الصورة الدقيقة واستخدام السياق العالمي لتوجيه الانتباه، يحول النموذج البقع الخافتة إلى أجسام معترف بها بثقة. مع أنه لا يزال قد يفشل في ظروف قصوى—مثلما يكون معظم الكائن مخفيًا أو عندما يكون التشويش الحركي شديدًا—إلا أن العمل يمثل خطوة عملية نحو المراقبة واسعة النطاق والزمن الحقيقي لإدارة المرور، والمراقبة البيئية، والأمن، والاستجابة للطوارئ، حيث يمكن أن يُحدث رؤية التفاصيل الصغيرة بسرعة فرقًا كبيرًا.
الاستشهاد: Wu, Z., Li, N., Tian, Z. et al. A lightweight feature fusion network for weak and small target detection in remote sensing. Sci Rep 16, 13295 (2026). https://doi.org/10.1038/s41598-026-43560-2
الكلمات المفتاحية: الاستشعار عن بعد, اكتشاف الأجسام الصغيرة, شبكة عصبية خفيفة الوزن, صور الطائرات بدون طيار, مراقبة الأرض