Clear Sky Science · zh
基于机学习并利用原位观测得到的全球0.25度网格化雪水当量数据
为什么全球雪对日常生活至关重要
雪不仅是冬日景观;它是一个巨大的天然水库,在寒冷季节储存水分,并在春季释放以补给河流、农田、城市和水力发电。了解世界各地雪中锁存了多少水,有助于社会为洪水、干旱以及变暖气候下的水资源转移做好准备。然而,告诉我们这些信息的关键量——雪水当量,在全球尺度上出乎意料地难以准确测量。

称量世界积雪的难题
科学家可以在特定地点通过雪观测线、用于称重雪盖的自动气垫以及其它地面站来测量雪。北美、欧洲和俄罗斯的观测网络数十年来一直在收集此类数据。卫星、天气模式和雷达仪器也提供与雪有关的线索。但每一种来源都有空白与弱点,尤其是在深雪区、森林与陡峭山地。结果是,现有的全球地图常常在雪量上存在分歧,许多地区(如安第斯山或亚洲部分地区)仍然描述不清。
教计算机从雪与天气中学习
为填补这些空白,作者们构建了一个名为SWEML的新日尺度全球雪水数据集,采用了一种称为随机森林的机器学习方法。他们收集了来自多个国家的长期地面雪观测记录,以及基于卫星的产品和提供一致温度、降水、辐射与风场的现代全球再分析资料。由于地形特征(如海拔、坡度和植被类型)强烈影响雪的累积与融化,这些特征也被加入模型。团队将世界的多雪网格单元分为14个具有类似气候与地形特征的区域,然后为每个区域分别训练机器学习模型,以便系统能更准确地学习当地的雪行为。
从分散观测点到全球日雪图
由于不同机构以不同方式测量雪,原始站点数据并不总是可直接对齐。研究人员首先调整每个站点的记录,使其平均值与变异度与一个被广泛使用的全球气象产品相匹配,同时保留原始观测的日际波动。此步骤在不抹去地方特征的情况下,使输入数据更为一致。随机森林模型随后学习这些经调整的雪值与周围气象和地形之间的关联。训练完成后,模型被用于估算地球上除南极外每个0.25度网格单元从1980年到2020年的日雪水当量,从而产出无缝的41年记录。

将地图与其它资料比对验证
团队对SWEML进行了严格的多种独立参考比较。这些参考包括通过空中伽马射线测量推断雪水(基于雪对天然辐射的阻挡效果)的北美调查、利用卫星影像为安第斯构建的高分辨率雪图,以及一系列常用的全球雪与陆面数据集。在与未用于训练的地面观测进行的上百万次比较中,SWEML显示出最低的典型误差和较小的总体偏差,略微倾向于低估雪量。它在落基山脉与阿尔卑斯等高山地区表现尤为出色——许多其他产品在这些地区常常困难重重——并且比同类产品更忠实地再现了季节性模式,如积雪峰值的时间与规模。
这对水资源与气候规划的意义
科学家与水务管理者首次拥有了一个基于机器学习的、全球连续的四十多年日尺度雪中储水记录。SWEML并不能取代当地的实地工作,并且在极其崎岖的地形或缺乏训练数据的地区仍面临挑战。但它为追踪变化中的雪资源、改进洪水与干旱风险评估以及为需要一致长期输入的气候与水文模型提供了一个强有力的新基础。在冬季格局不断转移的世界里,这种对地球雪水库的宏观视角是朝着更智慧水资源管理迈出的重要一步。
引用: Seo, J., Panahi, M., Kim, J. et al. Global 0.25-degree gridded Snow water equivalent data derived from machine learning using in-situ measurements. Sci Data 13, 739 (2026). https://doi.org/10.1038/s41597-026-06895-z
关键词: 雪水当量, 机器学习, 全球雪数据集, 水文学, 气候变化