Clear Sky Science · zh

基于 OSM 与 Google 卫星影像的长江泊位开放数据集(2024)

· 返回目录

河流码头为何与日常生活息息相关

在大江大河的河岸边,码头静静地维系着区域经济的运转。这里是农产品、工厂制成品和日常必需品装卸的节点,将小城镇与国内外贸易联系起来。然而,尽管重要性显著,许多内河码头的地图标注却很不完整,这使得规划者、环境管理者和应急响应者难以获得全貌。本研究基于可公开获取的在线地图和卫星影像,构建了第一份详细的、开放的长江内河码头地图,包含数千处码头,便于任何人探索与分析这一关键基础设施。

细看这条巨河

长江是世界第三长河,也是中国最繁忙的内河航道,承担着超过40%的国家经济产出。其上中下游沿线分布着形状与规模各异的码头。作者将重点放在两类主要码头:漂浮码头,即浮于水面并通过坡道与岸连接的设施;以及垂直码头,即由混凝土支撑形成的坚固平台。以一致的方法绘制这些结构不仅是地图制作的问题,还是理解贸易、工业与社区如何沿这条巨大河系布局的基础。

Figure 1
Figure 1.

把志愿者地图和卫星影像变成可用数据

为在漫长的河道上高效发现码头,研究者结合了两个免费数据源:OpenStreetMap(志愿者绘制码头与码头等要素)和高分辨率的 Google 卫星影像(显示地面或水面上的真实形状)。研究团队首先用标准标签从 OpenStreetMap 抽取所有候选码头位置。在每个位置周围建立小的方形区域并下载详细卫星图像。人工标注员随后在可见的码头周围绘制边框并标注其为漂浮或垂直,同时谨慎排除附近的船舶与辅助结构。这一流程产生了经过策划的 2,717 个确认码头样本,可用于教计算机从太空影像中识别内河码头的样貌。

教计算机识别微小的码头

有了训练集后,团队评估了流行目标检测方法家族 YOLO 的八个变体。这些模型通过扫描图像寻找与示例匹配的模式,返回可能的目标位置。在训练样本有限且码头形状不规则的情形下,较简单的 YOLOv5 反而比更新、更复杂的版本表现更好。仍然存在一项主要挑战:在卫星影像中,微小的漂浮码头常与抛锚的船舶相似。为减少混淆,研究者设计了一种多尺度策略,在小格与大格图像上同时运行检测并交叉比对结果。当某一检测在两种尺度上都持续出现时,更可能是真实码头,而不是船舶或噪声。

Figure 2
Figure 2.

构建可信的数千处码头地图

采用表现最好的模型与多尺度方法,研究在长江沿线检测到 3,562 处码头——其中 2,738 处为漂浮码头,824 处为垂直码头。作者提供了两类互补的数据产品:显示每个码头所在位置的简单矩形框,以及描绘实际码头形状的更详尽轮廓。为验证这些轮廓的可靠性,专业测绘人员在相同卫星影像上独立重绘了样本码头边界,其结果与数据集高度一致,表明准确性较高。在正式测试中,该方法在检测召回和误报控制方面均获得了高分,证明这不仅是粗略草图,而是一幅稳健可用的地图。

这对河流、贸易与环境意味什么

通过将分散的志愿者地图条目与原始卫星影像转化为干净的开放数据集,这项工作为规划者、经济学家和环境科学家提供了观察长江的新视角。该数据可用于识别码头聚集区、评估基础设施分布的公平性,以及分析码头位置与当地经济与水质的关系。它还能帮助模拟某些码头中断如何在更广泛的航运网络中产生连锁反应。尽管该数据集聚焦于一条河流,但相同的方法——结合市民制图数据、高分辨率影像与智能检测技术——可推广到世界各地的河流系统。简而言之,研究展示了如何利用免费且全球性的数字工具,将运输网络中隐藏的部分变得可见、可测量并更易于负责任地管理。

引用: Zhou, Q., Ren, F., Zhang, H. et al. An Open Dataset of Yangtze River Docks Based on OSM and Google Satellite Imagery (2024). Sci Data 13, 645 (2026). https://doi.org/10.1038/s41597-026-06901-4

关键词: 长江, 内河码头, 卫星影像, OpenStreetMap, 港口基础设施