Clear Sky Science · ar

طريقة تجزيء دلالي عالية الدقة لصور الاستشعار عن بعد مع عينات قليلة

· العودة إلى الفهرس

لماذا تهم صور السماء الأذكى

من تتبّع الفيضانات إلى رسم خرائط الضواحي الجديدة، تعتمد العديد من القرارات الحديثة على صور مفصّلة تلتقطها الطائرات الصغيرة من دون طيار. تحويل هذه الصور إلى خرائط واضحة للطرق والحقول والمباني والمسطحات المائية عادة ما يتطلب آلاف الوسوم المرسومة يدويًا من خبراء. تُظهر هذه الدراسة كيف يمكن لأجهزة الحاسب أن تتعلّم صنع خرائط دقيقة من صور الدرون مستخدمة عددًا أقل بكثير من الأمثلة الموسومة يدويًا، الأمر الذي قد يقلّل التكاليف ويسرّع الأعمال البيئية والحضرية الحيوية.

Figure 1. كيف تحوّل الطائرات الدرون عددًا قليلاً من الصور الموسومة إلى خرائط تغطية أرضية دقيقة باستخدام خطوات تعلم ذكية.
Figure 1. كيف تحوّل الطائرات الدرون عددًا قليلاً من الصور الموسومة إلى خرائط تغطية أرضية دقيقة باستخدام خطوات تعلم ذكية.

تعليم الحواسيب قراءة المشهد

صور الدرون حادة للغاية، تكشف أسطح الأسطح، وتاج الأشجار، والمسارات الضيقة، وحواف الشواطئ. بينما تُعد هذه التفاصيل ذات قيمة، فإنها تجعل أيضًا عملية الخرائط الآلية أصعب. اعتمدت الأساليب التقليدية على قواعد مصممة يدويًا تتعلق بالملمس واللون، والتي تصطدم بصعوبة في مثل هذه المشاهد المعقدة. دفع التعلم العميق الدقة أعلى بكثير بالسماح للشبكات العصبية بتعلّم الأنماط مباشرة من البيانات. لكن لهذه القوة ثمن: للعمل جيدًا، تتطلب هذه الشبكات عادة مجموعات بيانات موسومة ضخمة، ورسم حدود بكسل بدقة لكل كائن في كل صورة بطيء ومكلف.

إعادة استخدام المعرفة من صور أخرى

اختصار شائع هو البدء بنماذج مُدرَّبة على مجموعات صور ضخمة مثل ImageNet ثم ضبطها على صور الدرون. خيار آخر هو تقليص المعرفة، حيث يوجّه نموذج "معلم" قوي نموذج "طالب" أصغر بمشاركة أنماط خرج المعلم. مع ذلك، تختلف الصور اليومية اختلافًا كبيرًا عن الصور الملتقطة من الجو، سواء في زاوية الرؤية أو في المحتوى. عندما يتوفر عدد محدود فقط من صور الدرون الموسومة، قد لا يوفر المعلم الذي رُوّض على الصور الطبيعية إرشادًا مفيدًا بما يكفي، ويمكن أن يفشل الطالب في تحقيق إمكاناته.

بناء جسر تعلم واستخدام البيانات غير الموسومة

يقترح المؤلفون إطار عمل يعالج المشكلتين معًا: ندرة الوسوم وعدم التوافق بين الصور الطبيعية وصور الدرون. أولًا، يرفعون مستوى شبكة خرائط شائعة، DeepLabV3+، باستبدال العمود الفقري بشيء مصمم للحفاظ على التفاصيل الدقيقة وإضافة وحدة انتباه تبرز الميزات المهمة. بعد ذلك، يُدخلون خطوة وسيطة بين الصور الطبيعية ومجموعة بيانات الدرون النهائية. يُضبط النموذج أولًا على مجموعة بيانات استشعار عن بعد متوسطة الحجم، ثم تنتقل معرفته على مراحل إلى نماذج طلابية جديدة تتكيف تدريجيًا مع مجموعة بيانات الدرون النهائية. طوال هذا المسار، تساعد دوال خسارة خاصّة الطالب على نسخ سلوك المعلم دون نسيان الدروس المفيدة السابقة.

Figure 2. كيف تُحسّن آلية التعليم المرحلي بين المعلم والطالب والصور غير الموسومة نموذجًا يقسم مشاهد الدرون إلى أنواع أرضية.
Figure 2. كيف تُحسّن آلية التعليم المرحلي بين المعلم والطالب والصور غير الموسومة نموذجًا يقسم مشاهد الدرون إلى أنواع أرضية.

ترك النموذج يتعلم من ما هو غير موسوم

لاستغلال العديد من صور الدرون غير الموسومة بشكل أفضل، يضيف الإطار مرحلة شبه مُراقَبة. هنا يقوم نموذج المعلم المحدث وذاتيًا بوسم الصور غير الموسومة ويحتفظ فقط بالتنبؤات التي يثق فيها بشدة. تُستخدم هذه "الوسوم الوهمية" جنبًا إلى جنب مع مجموعة الوسوم البشرية الصغيرة لتدريب نموذج الطالب الذي يجب أن يبقى متسقًا مع المعلم على كل من البيانات الحقيقية والموسومة وهميًا. تُحدَّث أوزان المعلم ببطء من تقدم الطالب، مما يخلق حلقة يتحسّن فيها كلاهما معًا. تُظهر الاختبارات على مجموعة بيانات درون مفصّلة لمنطقة Erhai في الصين أن هذه الاستراتيجية ترفع دقة الخرائط بشكل ملحوظ، خصوصًا للطرق والأراضي الزراعية، حتى عندما تكون نسبة الصور الموسومة ضئيلة.

مدى فاعلية النهج في أماكن مختلفة

خارج مجموعة بيانات Erhai، يطبّق الباحثون طريقتهم على معيار شائع لمشاهد الشوارع. بإدراج مجموعة بيانات وسيطة مناسبة تشبه مشاهد الشوارع الحضرية، يرون مرة أخرى أداءً أفضل من الطرق الرائدة الأخرى، لا سيما عندما تكون الصور الموسومة نادرة. تكشف التجارب أيضًا أن اختيار مجموعة البيانات الوسطية المناسبة أمر حاسم: عندما تكون المشاهد في هذه الخطوة الوسيطة مختلفة جدًا عن الهدف النهائي، قد ينخفض الأداء بدلًا من أن يرتفع. عمومًا، يوفر الجمع بين التعليم المرحلي، والبنية المحافظة على التفاصيل، والاستخدام الذكي للبيانات غير الموسومة وصفة مرنة تتكيف مع مهام خرائطية متنوعة.

ماذا يعني هذا للخرائط العملية

بالنسبة لغير المتخصصين، الرسالة الأساسية هي أن الخرائط عالية الجودة من صور الدرون لم تعد تتطلب كميات هائلة من التتبع اليدوي. من خلال إعادة استخدام المعرفة بعناية من مجموعات الصور الكبيرة، وإضافة مجموعة بيانات جسرية محسوبة، وترك النموذج يعلّم نفسه من الصور غير الموسومة، تُقدّم الطريقة المقترحة خرائط تغطية أرضية أكثر دقة مع عمل يدوي أقل بكثير. قد يجعل هذا من الأسهل للمخططين المحليين والمزارعين وفرق الاستجابة للكوارث الحصول على عروض مفصّلة ومحدثة للأراضي مع ضبط الوقت والتكاليف.

الاستشهاد: Jiang, HL., Wang, N., Geng, B. et al. A few-shot high-resolution remote sensing image semantic segmentation method. Sci Rep 16, 15262 (2026). https://doi.org/10.1038/s41598-026-46887-y

الكلمات المفتاحية: الاستشعار عن بعد, صور الطائرات بدون طيار, التجزئة الدلالية, التعلم شبه المُراقَب, تقليص المعرفة