Clear Sky Science · zh
用于中国农业与农村场景分类的多标签超高分辨率卫星影像数据集
为何从太空绘制乡村地图很重要
在中国,乡村正在快速变化:旧田地上出现新的温室,太阳能发电场在山坡上扩展,公路将曾经孤立的村庄连成一片。然而,大多数基于卫星的地图仍将所有这些归为像“农业”这样单一且单调的类别。本文介绍了 China‑MAS‑50k,这是一套新的开放数据集,利用超高分辨率的卫星影像并对每个场景采用多标签标注,使计算机能够更精细地识别中国乡村景观。它为在国家尺度上更好地跟踪粮食生产、乡村发展与环境变化提供了基础。

同时识别多种地物
传统的卫星地图通常只为每个图像块分配一个标签——例如森林、城市或农田。现实地点很少如此单一:一幅航拍快照可能同时显示村庄、周边田地、池塘、公路,以及像太阳能板或塑料覆盖的温室等现代设施。China‑MAS‑50k 项目接受这种复杂性,将每张图像视为多种要素的混合体。它不强制单一选择,而是允许向同一图片附加多个标签,更好地契合人们实际观测和利用土地的方式。
构建中国乡村的详细图景
为构建该数据集,团队以 Google Earth 上可自由获取的超高分辨率影像为基础,主要来自能够显示略大于一米宽特征的现代商业卫星。他们在全国范围叠加了 50 公里网格以均匀采样,然后在乡村区域选取点位,下载每点 512×512 像素的小切片。对云、积雪、模糊或单一均质表面过多的图像进行了过滤,最终留下 55,520 幅清晰场景,主要采集于 2023–2024 年。这些切片覆盖了全国多样的地貌,但在著名的“胡焘线”以东人口与耕地密集的地区尤为集中。
将像素转化为有意义的地表类型
研究人员设计了一个包含 18 类的标签体系,专门针对乡村生活。它包括农田、林地、草地、河流、湖泊或池塘、裸地、道路与铁路等自然表面,以及村庄、工厂、运动场、公园、地膜覆盖、温室、光伏(太阳能)电站、建筑工地用的防尘网和固体废物堆放等人工要素。人工标注员遵循详细的视觉指南,描述典型的颜色、纹理与形状——例如树影指示林地、长条明亮结构表示温室、整齐行列的深色板块代表太阳能场。使用开放标注工具,三位专家对每张图像标注所有可见类别,并互相复核以捕捉错误。最终得到 135,289 条标签,组织方式便于将每张图像与其完整的地表类型列表配对。

测试机器的真实识别能力
有了这一新的基准数据集,作者评估了一系列流行的计算模型。这些模型包括基于决策树的经典机器学习方法以及最初为照片识别等任务设计的深度神经网络。所有模型都以相同的三通道彩色图像为输入,预测每个场景中出现的 18 个类别。总体上,现代深度网络的表现优于传统方法。其中名为 ResNeXt‑101 的模型在各项准确度指标上取得了最好的平衡,较好地捕捉到常见要素如农田、林地和道路。然而,它在识别诸如防尘网、地膜覆盖和光伏电站等较罕见的类别上表现较差,揭示了在类分布呈“长尾”——少数类别常见而多数稀少——的数据集中,算法从有限样本中学习的困难。
对未来乡村洞察的意义
China‑MAS‑50k 不仅仅是一大批精美卫星影像。它是一个经过严格校验的开放资源,反映了中国乡村景观的真实多样性以及传统与现代农业分布的不均衡。通过允许每张图像拥有多个标签,它可以支持诸如弱监督制图等高级任务,使计算机仅凭粗糙的场景级标签学习勾画田地、温室或道路的边界。它也为应对类别不平衡问题提供了现实的测试平台,而这正是将人工智能应用于真实世界杂乱数据时的一大瓶颈。简言之,该数据集使科学家和规划者更容易教会计算机识别乡村地面上真实发生的事,并追踪这些地方随时间的演变。
引用: Yuan, S., Feng, Q., Niu, B. et al. A multi-label dataset for China’s agricultural and rural scenes classification from VHR satellite imagery. Sci Data 13, 384 (2026). https://doi.org/10.1038/s41597-026-06800-8
关键词: 遥感, 乡村景观, 农业制图, 多标签数据集, 卫星影像