Clear Sky Science · ru

Мульти-меточный набор данных для классификации сельских и аграрных ландшафтов Китая по ОРИ спутниковым изображениям очень высокого разрешения

· Назад к списку

Почему важно картографировать сельскую местность из космоса

По всему Китаю сельская местность быстро меняется: на старых полях появляются теплицы, на склонах растут солнечные фермы, а дороги связывают когда‑то изолированные села. Тем не менее большинство карт на основе спутниковых данных по‑прежнему сводят всё это к одной скучной категории вроде «сельского хозяйства». В этой статье представлен China‑MAS‑50k — новый открытый набор данных, который позволяет компьютерам видеть сельский Китай гораздо детальнее, используя очень четкие спутниковые снимки и присваивая сценам несколько меток одновременно. Он создаёт основу для более точного отслеживания производства продовольствия, сельского развития и экологических изменений в масштабе страны.

Figure 1
Figure 1.

Видеть одновременно несколько объектов

Традиционные спутниковые карты обычно присваивают каждому фрагменту изображения только одну метку — лес, город или пашня, например. Реальные места редко так просты: один аэрофотоснимок может одновременно показывать поселок, окружающие поля, пруд, дорогу и современные объекты вроде солнечных панелей или теплиц с пластиком. Проект China‑MAS‑50k учитывает эту сложность, рассматривая каждое изображение как смесь элементов. Вместо того чтобы навязывать единственный выбор, он допускает множество меток для одной картины, что лучше соответствует тому, как люди действительно видят и используют землю.

Построение детальной картины сельского Китая

Для создания набора данных команда использовала свободно доступные изображения очень высокого разрешения из Google Earth, в основном со спутников коммерческого класса, способных показывать объекты чуть больше метра в ширину. По всей территории Китая наложили сетку с шагом 50 километров, чтобы равномерно распределить отбор, затем выбрали точки в сельской местности и скачали небольшие плитки изображений размером 512 на 512 пикселей в каждой точке. Изображения с избытком облаков, снегом, размытием или однородной поверхностью отфильтровали, в результате осталось 55 520 четких сцен, собранных в основном в 2023–2024 годах. Эти плитки охватывают разнообразные ландшафты страны, но особенно плотны в более интенсивно обрабатываемых регионах к востоку от известной «линии Ху», где сосредоточено большинство населения и сельхозугодий Китая.

Преобразование пикселей в осмысленные типы земель

Исследователи разработали систему из 18 категорий, адаптированную к сельской жизни. Она включает естественные поверхности, такие как пашни, леса, луга, реки, озера или пруды, оголенная земля, дороги и железные пути, а также антропогенные объекты: сельские поселения, заводы, спортивные площадки, парки, пластиковая мульча, теплицы, фотогальванические (солнечные) станции, пылезащитные сетки на стройплощадках и кучи твёрдых отходов. Аннотаторы следовали подробным визуальным инструкциям, описывающим типичные цвета, текстуры и формы — например, тени от деревьев как признак леса, длинные светлые полосы для теплиц, тёмные панели в аккуратных рядах для солнечных ферм. С помощью открытого инструмента аннотирования три эксперта пометили каждое изображение всеми видимыми категориями, проверяя работу друг друга для исключения ошибок. В итоге получено 135 289 меток, организованных так, чтобы каждое изображение можно было легко сопоставить с полным списком типов покрытий.

Figure 2
Figure 2.

Проверка реального уровня интеллекта машин

Имея этот новый эталон, авторы оценили ряд популярных моделей. Сюда вошли классические методы машинного обучения на основе деревьев решений и более глубокие нейронные сети, изначально разработанные для задач распознавания фотографий. Всем моделям подавались те же три цветовые канала изображений, и их просили предсказать, какие из 18 категорий присутствуют в каждой сцене. В целом современные глубокие сети показали себя лучше старых подходов. Среди них модель ResNeXt‑101 обеспечила наилучший баланс метрик точности, относительно хорошо выделяя распространённые элементы, такие как пашни, леса и дороги. Однако она испытывала трудности с редкими объектами, такими как пылезащитные сетки, пластиковая мульча и солнечные станции, что показывает, насколько сложно алгоритмам учиться на ограниченных примерах в «длиннохвостом» наборе данных, где несколько классов распространены, а многие — редки.

Что это значит для будущих исследований сельской местности

China‑MAS‑50k — это не просто большая коллекция красивых спутниковых снимков. Это тщательно проверенный открытый ресурс, отражающий истинное разнообразие сельских ландшафтов Китая и неравномерное распределение традиционного и современного сельского хозяйства. Позволяя присваивать нескольким меткам одно изображение, набор поддерживает продвинутые задачи, такие как слабо контролируемое картирование, когда компьютеры учатся выделять поля, теплицы или дороги, имея только грубые метки сцены. Он также предоставляет реалистичную площадку для преодоления дисбаланса классов — ключевого узкого места при применении ИИ к шумным реальным данным. Проще говоря, этот набор данных облегчает учёным и планировщикам задачу научить компьютеры тому, что действительно происходит на земле в сельском Китае, и отслеживать, как эти места продолжают меняться со временем.

Цитирование: Yuan, S., Feng, Q., Niu, B. et al. A multi-label dataset for China’s agricultural and rural scenes classification from VHR satellite imagery. Sci Data 13, 384 (2026). https://doi.org/10.1038/s41597-026-06800-8

Ключевые слова: дистанционное зондирование, сельские ландшафты, картирование сельского хозяйства, мульти-меточные наборы данных, спутниковые изображения