Clear Sky Science · ar

مجموعة بيانات متعددة الوسوم لتصنيف المشاهد الزراعية والريفية في الصين من صور الأقمار الصناعية عالية الدقة

· العودة إلى الفهرس

لماذا يهم رسم الخرائط للريف من الفضاء

في جميع أنحاء الصين، يتغير الريف بسرعة: تظهر بيوت زجاجية جديدة في الحقول القديمة، وتمتد مزارع الطاقة الشمسية على المنحدرات، وتربط الطرق القرى التي كانت معزولة سابقًا. ومع ذلك لا تزال معظم الخرائط المبنية على الأقمار الصناعية تتعامل مع كل ذلك كفئة واحدة مُمثلة بتسمية عامة مثل «زراعة». تعرض هذه المقالة China‑MAS‑50k، مجموعة بيانات مفتوحة جديدة تتيح للحواسب رؤية الريف الصيني بتفصيل أكبر بكثير، باستخدام صور فضائية عالية الحدة والقدرة على وضع وسوم متعددة لكل مشهد. توفر هذه المجموعة أساسًا أفضل لمتابعة إنتاج الغذاء، وتطور المناطق الريفية، والتغير البيئي على مستوى وطني.

Figure 1
الشكل 1.

رؤية أكثر من شيء واحد في الوقت نفسه

عادة ما تمنح الخرائط الفضائية التقليدية وسمًا واحدًا لكل قطعة صورة—مثل غابة أو مدينة أو أراضٍ مزروعة. الأماكن الحقيقية نادرًا ما تكون بهذه البساطة: قد تُظهر لقطة جوية واحدة قرية وحقولًا محيطة وبركة وطريقًا ومنشآت حديثة مثل الألواح الشمسية أو البيوت البلاستيكية مغطاة بالبلاستيك في الوقت نفسه. يتبنّى مشروع China‑MAS‑50k هذه التعقيدات بمعالجة كل صورة كمزيج من العناصر. بدلًا من إجبار اختيار وحيد، يسمح بوضع عدة وسوم على نفس الصورة، مما يتطابق بشكل أفضل مع كيفية رؤية الناس للأرض واستخدامها فعليًا.

بناء صورة مفصّلة للريف الصيني

لبناء مجموعة البيانات، بدأ الفريق بوسوم من الصور عالية الدقة المتاحة مجانًا على Google Earth، مأخوذة بشكل أساسي من أقمار صناعية تجارية حديثة قادرة على إظهار عناصر يبلغ عرضها حوالي متر واحد. وضعوا شبكة بمسافة 50 كيلومترًا على كامل الصين لتوزيع العينات بشكل متساوٍ، ثم اختاروا نقاطًا في المناطق الريفية وقاموا بتحميل بلاطات صور صغيرة بحجم 512×512 بكسل عند كل نقطة. تم فلترة الصور التي تحتوي على سحب كثيرة أو ثلج أو ضباب أو سطح موحد واحد، مما ترك 55,520 مشهدًا واضحًا جُمعت أساسًا في 2023–2024. تغطي هذه البلاطات تنوع المشاهد في البلاد، لكنها مكثفة بشكل خاص في المناطق الزراعية الأكثر كثافة شرق «خط هو» الشهير، حيث يعيش معظم سكان الصين وتوجد معظم الأراضي المزروعة.

تحويل البكسلات إلى أنواع أرضية ذات معنى

صمّم الباحثون نظام وسوم مكوّن من 18 فئة مصممة لملاءمة الحياة الريفية. يشمل النظام أسطحًا طبيعية مثل الأراضي المزروعة، والغابات، والمراعي، والأنهار، والبحيرات أو البرك، والأراضي العارية، والطرق والسكك الحديدية، بالإضافة إلى عناصر من صنع الإنسان مثل القرى الريفية، والمصانع، والملاعب الرياضية، والمتنزهات، والغطاء البلاستيكي (الغطاء المضاد للتبخر)، والبيوت البلاستيكية، ومحطات الطاقة الكهروضوئية (الشمسية)، وشبكات مضادة للغبار المستخدمة في مواقع البناء، وأكوام النفايات الصلبة. اتبع المراجعون البشريون إرشادات بصرية مفصلة تصف الألوان والأنسجة والأشكال النموذجية—على سبيل المثال ظلال الأشجار التي تشير إلى الغابات، أو الشرائط الطويلة اللامعة للبيوت البلاستيكية، أو الألواح الداكنة المصطفة في صفوف مرتبة لمزارع الطاقة الشمسية. باستخدام أداة تعليق مفتوحة، قام ثلاثة خبراء بوضع وسوم لكل صورة لكل الفئات المرئية، وتحققوا من أعمال بعضهم البعض لالتقاط الأخطاء. النتيجة هي 135,289 وسمًا، منظمة بحيث يمكن إقران كل صورة بسهولة بقائمتها الكاملة لأنواع تغطية الأرض.

Figure 2
الشكل 2.

اختبار مدى ذكاء الآلات فعلاً

مع هذا المعيار الجديد في اليد، قيّم المؤلفون مجموعة من النماذج الحاسوبية الشائعة. شملت هذه أساليب التعلم الآلي التقليدية القائمة على أشجار القرار، وشبكات عصبية عميقة صُممت أصلاً لمهام مثل التعرف على الصور. تلقت كل النماذج نفس مدخلات الصور ذات الثلاث قنوات اللونية وطُلب منها التنبؤ بأي من الفئات الـ18 ظهرت في كل مشهد. عمومًا، تفوقت الشبكات العميقة الحديثة على النهج الأقدم. من بينها، قدّم نموذج يُدعى ResNeXt‑101 أفضل توازن لمقاييس الدقة، حيث التقط معظم العناصر الشائعة مثل الأراضي المزروعة والغابات والطرق بشكل معقول. مع ذلك، واجه صعوبات مع العناصر النادرة مثل الشبكات المضادة للغبار، والغطاء البلاستيكي، ومحطات الطاقة الشمسية، مما يكشف مدى صعوبة تعليم الخوارزميات من أمثلة محدودة في مجموعة بيانات ذات ذيول طويلة حيث تكون بعض الفئات شائعة والبعض الآخر نادرًا.

ماذا يعني هذا لرؤى مستقبلية عن الريف

توفر China‑MAS‑50k أكثر من مجرد مجموعة كبيرة من لقطات الأقمار الصناعية الجميلة. إنها مورد مفتوح تم التحقق من صحته بعناية ويعكس التنوع الحقيقي للمشاهد الريفية في الصين والتوزيع غير المتكافئ للزراعة التقليدية والحديثة. من خلال السماح بوسوم متعددة لكل صورة، يمكنها دعم مهام متقدمة مثل الخرائط ذات الإشراف الضعيف، حيث تتعلم الحواسب تحديد حدود الحقول أو البيوت البلاستيكية أو الطرق باستخدام وسوم مستوى المشهد فقط. كما توفر بيئة اختبار واقعية لمواجهة عدم توازن الفئات، وهو عنق زجاجة رئيسي في تطبيق الذكاء الاصطناعي على بيانات العالم الحقيقي الفوضوية. بعبارة بسيطة، تجعل هذه المجموعة من الأسهل للعلماء والمخططين تعليم الحواسب بما يحدث فعليًا على الأرض في الريف الصيني، ومتابعة كيفية استمرار تغير تلك الأماكن مع مرور الوقت.

الاستشهاد: Yuan, S., Feng, Q., Niu, B. et al. A multi-label dataset for China’s agricultural and rural scenes classification from VHR satellite imagery. Sci Data 13, 384 (2026). https://doi.org/10.1038/s41597-026-06800-8

الكلمات المفتاحية: الاستشعار عن بُعد, المشاهد الريفية, رسم خرائط زراعية, مجموعات بيانات متعددة الوسوم, صور الأقمار الصناعية