Clear Sky Science · ar
شبكة دمج معلومات الحواف بين المراحل لاكتشاف الأشياء الصغيرة في الصور الجوية
لماذا يهم اكتشاف التفاصيل الدقيقة من السماء
من مراقبة الحركة والاستجابة للكوارث إلى رعاية المحاصيل، يراقب العالم من فوق طائرات بدون طيار بشكل متزايد. ومع ذلك، فإن العديد من الأشياء التي نهتم بها في هذه الصور الجوية—الأشخاص أو السيارات أو الحيوانات—تظهر كقليلات البكسل فقط. يقدم هذا البحث نظام رؤية حاسوبية جديد، CEIFNet، مصمَّم خصيصًا للعثور على هذه الأجسام الصغيرة بدقة وسرعة أكبر، حتى عندما تكون محاطة بشوارع مدينة مزدحمة أو حقول أو ضوضاء ليلية.
رؤية الأشياء الصغيرة ضمن صورة كبيرة
تم بناء أنظمة كشف الأجسام القياسية أساسًا لصور مأخوذة من مستوى الأرض، حيث عادة ما يملأ السيارة أو الشخص جزءًا ملحوظًا من الإطار. في صور الطائرات بدون طيار، قد تكون الكاميرا مئات الأمتار فوق الأرض، لذا يكون كل هدف ضئيلًا وسهل الضباب أو الفقدان عند تصغير الصورة داخل شبكة عصبية. يشرح المؤلفون أن كاشفات إطار واحد الشائعة مثل عائلة YOLO تعمل جيدًا للمشاهد اليومية لكنها تكافح عندما تكون الأشياء صغيرة ومتفاوتة الحجم بشدة. يؤدي التكرار في تقليل العيّنات، المصمم لفهم المشهد بأكمله، إلى محو الإشارات الطفيفة من هذه الأهداف الصغيرة.
مزج الرؤية المقربة مع سياق الصورة الكبيرة
لمعالجة ذلك، تجمع CEIFNet بين طريقتين تكميليتين للرؤية. يستخدم مسار واحد فلاتر التفاف (Convolution) الكلاسيكية، الجيدة في التقاط الأنماط المحلية الواضحة مثل الزوايا والملمس. أما المسار الآخر فيستخدم آلية انتباه على طراز المحول (Transformer)، المتفوقة في ربط أجزاء بعيدة من الصورة وفهم المشهد ككل. داخل البنية الأساسية المسماة كتلة المحول عبر المراحل (cross-stage transformer block)، تُقسَم ميزات الصورة الواردة: يمر معظم القنوات عبر مسار التفاف خفيف الوزن، بينما يمر جزء أصغر عبر مسار انتباه يعالج العلاقات بعيدة المدى. تُعاد هذه الميزات بعد ذلك لتمكن الشبكة من الحصول على تفاصيل دقيقة ووعي عالمي دون تضخيم تكلفة الحوسبة بشكل كبير.

استخدام الحواف كخريطة للأهداف الصغيرة
رؤية رئيسية في الورقة هي أن حدود الأجسام—الحواف—ذات قيمة خاصة عندما تكون الأهداف بعرض بضعة بكسلات فقط. بدلاً من الاعتماد فقط على الفلاتر المتعلّمة، يقوم المؤلفون بإدخال معلومات الحواف عمدًا في الشبكة. يطبق وحدة مخصصة أولاً عامل سوبل، كاشف حواف بسيط لكنه قوي، لتسليط الضوء على أماكن تغير السطوع بشكل حاد، مثل محيط السيارات أو الأشخاص. تُجمّع خرائط الحواف هذه بأحجام متعددة لمطابقة مقاييس الميزات المختلفة وتُدمج عبر وحدة عبر القنوات. مع تقدم الصورة داخل الشبكة، تُغذى إشارات الحواف هذه مرارًا إلى الطبقات المتأخرة، مما يساعد النموذج على تتبع مكان بداية ونهاية الأجسام الصغيرة رغم التمويه والتصغير المعتاد.
التكيّف مع الحجم والموقع وتعقيد المشهد
في المخرج، تستخدم CEIFNet رأس كشف ديناميكي قادر على تعديل سلوكه وفقًا لما يرى. بدلاً من استخدام فلاتر ثابتة، تطبّق هذه المرحلة النهائية ثلاثة أشكال من الانتباه في آن واحد: يمكنها تفضيل أحجام معينة من الأجسام، التركيز على المواقع الأكثر وعدًا داخل الصورة، وإبراز قنوات الميزات الأكثر معلوماتية. إلى جانب بنية هرمية للميزات تحافظ على طبقة إضافية دقيقة الحبيبات، يجعل هذا النظام أكثر استجابة للأهداف الصغيرة والكثيفة في لقطات الطائرات بدون طيار الواقعية، من تقاطعات مزدحمة إلى ساحات انتظار مشغولة ومشاهد حرارية بالأشعة تحت الحمراء ليلًا.

إثبات الفوائد في سيناريوهات طائرات حقيقية
اختبر الباحثون CEIFNet على مجموعتي بيانات من الطائرات بدون طيار تتطلبان أداءً عاليًا: VisDrone2019، التي تضم مشاهد حضرية وضواحي في ضوء النهار، وHIT-UAV، مجموعة حرارية بالأشعة تحت الحمراء حيث العديد من الأهداف باهتة وصغيرة. على كلتا المجموعتين، اكتشف النظام الجديد الأجسام بدقة أعلى من خط أساس قوي مبني على YOLO ومجموعة من الكاشفات الحديثة الأخرى، مع الاستمرار في العمل بسرعة كافية للاستخدام في الزمن الحقيقي على بطاقة رسومات قوية. أظهرت تجارب الإزالة الدقيقة أن كل جزء—الكتلة الهجينة، ووحدة الحواف، والطبقة الدقيقة الإضافية، والرأس الديناميكي—ساهم في التعزيز العام.
ماذا يعني هذا للتقنية اليومية
بالنسبة لغير المتخصصين، الخلاصة هي أن CEIFNet يقدم طريقة أذكى للطائرات بدون طيار لـ"ملاحظة الأشياء الصغيرة" في مشاهد واسعة ومعقدة. من خلال الحفاظ على معلومات الحواف، ودمج التفاصيل المحلية مع السياق العالمي، والتكيّف مع الانتباه ديناميكيًا، يمكن للشبكة اكتشاف الأجسام الصغيرة التي تفوّتها الأنظمة الأخرى أو تُخطئ في تحديد مواقعها. هذا يجعل المراقبة الجوية أكثر موثوقية لمهام مثل سلامة المرور، والبحث والإنقاذ، والزراعة الدقيقة، ويشير إلى أنظمة مستقبلية قادرة على استخلاص معلومات موثوقة من مشاهد أعلى وأوسع في عالمنا.
الاستشهاد: Xiao, J., Li, C., Chen, H. et al. Cross-stage edge information fusion network for small object detection in aerial images. Sci Rep 16, 7639 (2026). https://doi.org/10.1038/s41598-026-36251-5
الكلمات المفتاحية: كشف الأجسام الجوية, الأجسام الصغيرة, تصوير الطائرات بدون طيار, الرؤية المبنية على الحواف, التعلّم العميق