Clear Sky Science · ar

MFR-YOLO: تقدم اكتشاف الأجسام بالطائرات بدون طيار عبر تحسين الميزات متعددة المقاييس باستخدام الالتفاف القابل للتشكُّل والانتباه العالمي

· العودة إلى الفهرس

لماذا تهم رؤية الطائرات أفضل

من مراقبة المرور إلى البحث والإنقاذ بعد الكوارث، تعمل الطائرات بدون طيار بشكل متزايد كعيون طائرة لمدننا وحقولنا. ومع ذلك، فإن رصد سيارات أو أشخاص صغار وسريعي الحركة من الأعلى أصعب مما يبدو. تقدم هذه الدراسة MFR-YOLO، نهجًا محسنًا يمكّن الطائرات من تمييز العديد من الأجسام الصغيرة والمشوهة في الزمن الحقيقي، مما يساعد أنظمة التصوير الجوي على اتخاذ قرارات أكثر أمانًا وذكاءً.

تحدي الرؤية من السماء

تلتقط كاميرات الطائرات شوارع مزدحمة أو مزارعًا أو مناطق كوارث حيث تُشغل معظم الأهداف بضعة بكسلات فقط. تتغير أحجام الأجسام وزواياها بسرعة مع حركة الطائرة، وتتداخل المباني والأشجار والظلال مع ما نريد اكتشافه. غالبًا ما تفشل أنظمة الكشف التقليدية في رصد هذه الأهداف الصغيرة، أو تخلط بينها وبين الخلفية، أو تصبح بطيئة عند زيادة الدقة. توازن عائلة كاشفات YOLO الشهيرة بين السرعة والدقة، لكن مكوناتها التقليدية تفقد التفاصيل الدقيقة، وتواجه صعوبة مع الأشكال المائلة أو الممدودة، وتفتقر إلى أدوات قوية لتجاهل المشاهد المزدحمة.

Figure 1. كيف تحول الطائرات دون طيار المشاهد الجوية المزدحمة إلى خرائط أوضح للسيارات والأشخاص الصغار في الزمن الحقيقي.
Figure 1. كيف تحول الطائرات دون طيار المشاهد الجوية المزدحمة إلى خرائط أوضح للسيارات والأشخاص الصغار في الزمن الحقيقي.

طريقة جديدة للحفاظ على التفاصيل الصغيرة

يبني المؤلفون على YOLOv12 ويصممون MFR-YOLO لحماية التفاصيل الصغيرة مع الحفاظ على السرعة. أولاً، يضيفون وحدة استخراج ميزات متعددة المقاييس تتبع مسارين متوازيين. يركز أحد المسارين على الحفاظ على الحواف والملمس الحاد حتى لا تختفي الأشخاص والدراجات والسيارات عندما تُصغَّر الصور داخل الشبكة. يستخدم المسار الآخر مرشحات مرنة يمكنها «انحناء» مواقع أخذ العينات، لتتناسب بشكل أفضل مع الأجسام التي تظهر مائلة أو ممدودة أو مشوهة بسبب تغير منظور الطائرة. يؤدي دمج هذين المسارين إلى إنتاج خرائط أغنى لا تزال تحمل المعلومات الدقيقة اللازمة للتعرف على الأهداف الصغيرة جدًا.

تعليم النموذج ما هو مهم حقًا

لمنع الشبكة من التشتت بالسماء أو الأشجار أو المباني، يدمج الفريق وحدة انتباه عالمية في مرحلتي بناء الميزات وخلطها. تتعلم هذه الوحدة إبراز المناطق والأنماط التي تنتمي إلى الأهداف المحتملة مع تخفيف المناطق غير ذات الصلة. ينظر جزء منها عبر الصورة لتأكيد المواقع ذات الأهمية، مثل صفوف المركبات أو تجمعات المشاة. ويضبط جزء آخر قوة أنواع الأنماط المختلفة، بحيث تُعزَّز القنوات التي تصف الحواف والملمس المفيد بينما تُهدَّأ القنوات الصاخبة. معًا تساعد هذه خطوات الانتباه النموذج على توجيه جهده نحو الأجسام الحقيقية بدلاً من الفوضى الخلفية.

Figure 2. كيف تساعد الطبقات المحسّنة وآليات الانتباه نظام رؤية الطائرة على فصل وتوضيح العديد من الأجسام الصغيرة خطوة بخطوة.
Figure 2. كيف تساعد الطبقات المحسّنة وآليات الانتباه نظام رؤية الطائرة على فصل وتوضيح العديد من الأجسام الصغيرة خطوة بخطوة.

دمج دلائل المقرّب والمشهد الواسع

بخلاف التحسينات الفردية، يُحسِّن MFR-YOLO أيضًا كيفية دمج المعلومات عبر المقاييس المختلفة. يقسم كتلة ميزة مطوّرة، تسمى C3K2-PPA، البيانات إلى ثلاثة فروع. يركز أحدها على التفاصيل المحلية الصغيرة، وينظر آخر إلى رقع أوسع من المشهد، ويربط الثالث بينهما عبر سلسلة قصيرة من العمليات. ثم تتعلم الشبكة مقدار الوزن الذي تُعطيه لكل فرع لكل صورة، وتدمجها مرة أخرى مع وصلة اختصارية للحفاظ على استقرار التعلم. يتيح هذا التصميم للنظام فهم كل من الأجسام الصغيرة والسياق الأكبر حولها، وهو أمر حيوي عندما تتراكب المركبات أو الأشخاص أو تكون مخفية جزئيًا.

إلى أي مدى ينجح النهج الجديد

اختبر الباحثون MFR-YOLO على مجموعتي بيانات عامتين للطائرات: VisDrone2021، التي تغطي شوارع مدينة مزدحمة وظروف طقس متنوعة، وUA-DETRAC، التي تركز على حركة المركبات. بالمقارنة مع عدة كاشفات معروفة بما في ذلك Faster R-CNN وRetinaNet وإصدارات YOLO الحديثة ونماذج قائمة على المحولات، حقق MFR-YOLO دقة إجمالية أعلى، ومهمًّا، اكتشف عددًا أكبر بكثير من الأجسام الصغيرة جدًا مع فقدان أقل للأهداف. وقد فعل ذلك مع الحفاظ على سرعة المعالجة أعلى بكثير من المستوى المطلوب للاستخدام في الزمن الحقيقي على أجهزة الطائرات المدمجة النموذجية، ودون الحاجة إلى زيادة كبيرة في الذاكرة أو الحساب.

ما يعنيه هذا لاستخدام الطائرات العادي

بالنسبة لغير المتخصصين، الرسالة الأساسية هي أن MFR-YOLO يساعد الطائرات على رؤية الأجسام الصغيرة والمزدحمة بوضوح وسرعة أكبر في مشاهد العالم الحقيقي الفوضوية. من خلال إعادة تصميم كيفية احتفاظ النظام بالتفاصيل، والتكيف مع الأشكال المشوهة، وتركيز الانتباه، ودمج الرؤى المحلية والعالمية، يرفع المؤلفون جودة الكشف دون التضحية بالسرعة. وهذا يجعل أدوات الطائرات للمراقبة المرورية، ومراقبة الزراعة، والاستجابة للطوارئ أكثر موثوقية، ويقدم مخططًا لتكييف نماذج الرؤية لبيئات أخرى تتطلب أداء عاليًا.

الاستشهاد: Ge, J., Lv, H., Guo, Y. et al. MFR-YOLO: advancing UAV object detection with multi-scale feature refinement via deformable convolution and global attention. Sci Rep 16, 15587 (2026). https://doi.org/10.1038/s41598-026-45641-8

الكلمات المفتاحية: كشف الأجسام بواسطة الطائرات بدون طيار, كشف الأجسام الصغيرة, YOLO, صور الطائرات بدون طيار, رؤية حاسوبية