Clear Sky Science · tr
VHR uydu görüntülerinden Çin’in kırsal ve tarımsal sahnelerinin sınıflandırılması için çok etiketli bir veri seti
Kırsalı uzaydan haritalamanın önemi
Çin genelinde kırsal alanlar hızla değişiyor: eski tarlarda yeni seralar beliriyor, güneş enerjisi tarlaları yamaçlara yayılıyor ve yollar bir zamanlar izole olan köyleri birbirine bağlıyor. Buna rağmen uydu tabanlı haritaların çoğu tüm bu çeşitliliği hâlâ “tarım” gibi tek, tekdüze bir kategori olarak ele alıyor. Bu makale, çok keskin uydu görüntüleri ve sahne başına birden çok etiket kullanarak kırsal Çin’i çok daha ayrıntılı görmeyi sağlayan yeni açık veri seti China‑MAS‑50k’ı tanıtıyor. Veri seti, ulusal ölçekte gıda üretimi, kırsal kalkınma ve çevresel değişimi daha iyi izlemek için bir temel sunuyor.

Bir sahnede birden fazlasını görmek
Geleneksel uydu haritaları genellikle her görüntü parçasına tek bir etiket atar—örneğin orman, şehir veya tarla. Gerçek yerler nadiren bu kadar basittir: tek bir hava fotoğrafı aynı anda bir köyü, çevresindeki tarlaları, bir göleti, bir yolu ve güneş panelleri ya da plastik örtülü seralar gibi modern yapıları gösterebilir. China‑MAS‑50k projesi, her görüntüyü bir dizi öğenin karışımı olarak ele alarak bu karmaşıklığı kabul ediyor. Zorunlu bir seçim yapmak yerine, aynı resme birden çok etiket eklenmesine izin veriyor; bu da insanların araziyi gerçekten nasıl gördükleri ve kullandıklarıyla daha iyi örtüşüyor.
Kırsal Çin’in ayrıntılı bir resmini oluşturmak
Veri setini oluşturmak için ekip, Google Earth’ten serbestçe erişilebilen çok yüksek çözünürlüklü görüntülerle başladı; esas olarak bir metrenin biraz üzerindeki genişlikteki nesneleri gösterebilen modern ticari uydulardan elde edilen görüntüler kullanıldı. Örneklemeyi eşit yaymak için tüm Çin üzerine 50 kilometrelik bir ızgara yerleştirdiler, ardından kırsal alanlardaki noktalardan küçük 512×512 piksel görüntü parçalarını indirdiler. Çok fazla bulut, kar, bulanıklık veya tek tip yüzey içeren görüntüler elendi ve ağırlıklı olarak 2023–2024’te toplanmış 55.520 net sahne bırakıldı. Bu görseller ülkenin çeşitli peyzajlarını kapsıyor, ancak nüfusun ve tarım arazilerinin çoğunun bulunduğu ünlü “Hu Hattı”nın doğusundaki daha yoğun işlenen bölgelerde özellikle yoğundu.
Pikselleri anlamlı arazi tiplerine dönüştürmek
Araştırmacılar kırsal yaşama özgü 18 kategorilik bir etiket sistemi tasarladı. Sistem, tarla, ormanlık alan, çayır, nehirler, göller veya göletler, çıplak toprak, yollar ve demiryolları gibi doğal yüzeylerin yanı sıra kırsal köyler, fabrikalar, spor alanları, parklar, plastik örtü (mulç), seralar, fotovoltaik (güneş) tesisleri, inşaat sahalarında kullanılan toza karşı ağlar ve katı atık yığınları gibi insan yapımı özellikleri içeriyor. İnsan etiketleyiciler tipik renkleri, dokuları ve şekilleri tanımlayan ayrıntılı görsel yönergeleri takip etti—örneğin ormanlık alanı gösteren ağaç gölgeleri, uzun parlak şeritler şeklindeki seralar, düzenli sıralarda koyu paneller şeklindeki güneş tarlaları gibi. Açık kaynak bir not alma aracı kullanılarak her görüntü üç uzman tarafından görülebilen tüm kategorilerle etiketlendi ve hataları yakalamak için birbirlerinin çalışmalarını çapraz kontrol ettiler. Sonuç, her görüntünün tam arazi örtüsü listesiyle kolayca eşleştirilebileceği şekilde düzenlenmiş 135.289 etiket oldu.

Makinelerin gerçekten ne kadar akıllı olduğunu test etmek
Bu yeni kıyas setiyle yazarlar popüler birçok bilgisayar modelini değerlendirdiler. Bunlar, karar ağaçlarına dayanan klasik makine öğrenimi yöntemleri ve fotoğraf tanıma gibi görevler için tasarlanmış daha derin sinir ağlarını içeriyordu. Tüm modellere aynı üç renkli görüntü girdileri verildi ve her sahnede hangi 18 kategorinin göründüğünü tahmin etmeleri istendi. Genel olarak, modern derin ağlar daha eski yaklaşımları geride bıraktı. Bunların arasında ResNeXt‑101 adlı bir model doğruluk ölçümlerinin en iyi dengesiyle en başarılı performansı gösterdi; tarla, ormanlık alan ve yollar gibi yaygın öğelerin çoğunu makul ölçüde iyi yakaladı. Ancak toza karşı ağlar, plastik örtü ve güneş tesisleri gibi daha nadir özelliklerde zorlandı; bu da birkaç sınıfın yaygın, birçok sınıfın ise kıt olduğu “uzun kuyruklu” bir veri setinde algoritmaların sınırlı örneklerden öğrenmesinin ne kadar güç olduğunu ortaya koydu.
Gelecekteki kırsal içgörüler için anlamı
China‑MAS‑50k sadece güzel uydu fotoğraflarından oluşan büyük bir koleksiyon olmanın ötesinde bir kaynak sunuyor. Bu, Çin’in kırsal peyzajlarının gerçek çeşitliliğini ve geleneksel ile modern tarımın düzensiz dağılımını yansıtan dikkatle kontrol edilmiş, açık bir kaynak. Görüntü başına birden çok etikete izin vererek, bilgisayarların yalnızca kaba sahne düzeyindeki etiketlerle tarlaların, seraların veya yolların sınırlarını öğrenmesini sağlayan zayıf denetimli haritalama gibi gelişmiş görevleri destekleyebilir. Ayrıca dengesiz sınıf dağılımıyla başa çıkmak için gerçekçi bir test ortamı sağlar; bu, yapay zekayı karmaşık gerçek dünya verilerine uygulamada kilit bir darboğazdır. Basitçe söylemek gerekirse, bu veri seti bilim insanlarının ve planlamacıların bilgisayarlara kırsal Çin’de gerçekte neler olduğunu öğretmesini ve bu yerlerin zaman içinde nasıl değişmeye devam ettiğini takip etmesini kolaylaştırır.
Atıf: Yuan, S., Feng, Q., Niu, B. et al. A multi-label dataset for China’s agricultural and rural scenes classification from VHR satellite imagery. Sci Data 13, 384 (2026). https://doi.org/10.1038/s41597-026-06800-8
Anahtar kelimeler: uzaktan algılama, kırsal peyzajlar, tarımsal haritalama, çok etiketli veri setleri, uydu görüntüleri