Clear Sky Science · zh
一种基于卫星的机器学习方法,用于估算巴西一座特大城市的高分辨率日平均气温
为什么城市里的热度并非处处相同
在炎热的日子里,位于林荫街道上的体感温度可能与几条街外的混凝土广场截然不同。然而,大多数健康与气候研究仍然把整座城市当作具有单一温度的区域。本文展示了科学家如何利用卫星、天气模式和机器学习,在巴西圣保罗绘制出细致的每日温度地图——帮助揭示谁真正暴露在危险高温下,以及哪里最需要降温干预。

以高清方式测量城市温度
传统的气温记录依赖数量有限的气象站,这些站点常常集中在机场或较富裕的区域附近。这使得难以看清真实社区内的热力分布,尤其是在大城市以及监测网络稀疏的中低收入国家。研究者将注意力集中在圣保罗——一座超过2200万人口、地形与土地利用高度多样的特大城市。他们的目标是估算2015年至2019年间大都会区内每个500×500米网格的日平均气温,创建出南美迄今最为细致的城市温度数据集之一。
融合卫星、天气模式与地面传感器
为构建这一高分辨率图景,团队结合了几类可免费获取的数据。他们收集了48个地面站的测量值,这些站提供最直接的气温读数,但仅覆盖特定点位。然后他们引入了卫星观测的地表温度、太阳入射角与地表反射率,以及来自全球天气“再分析”产品的湿度、风速和气压等信息,该产品能以粗网格重建逐小时天气。这些要素被重采样以匹配500米网格,并清理以填补因云层或卫星错过观测而产生的空缺。总计他们测试了23个可能有助于解释温度时空变化的预测变量。
训练机器来解读热力
研究人员没有采用简单的直线(线性)方程,而是使用随机森林(Random Forest),这是一种通过构建大量决策树并对其结果取平均的流行机器学习方法。这种方法擅长揭示复杂的非线性关系,例如在城市不同区域或不同季节中,温度对地表热力、湿度和风的响应如何各不相同。为了避免对少数站点的特殊性过拟合,他们采用了逐步特征选择过程,仅保留真正能改进预测的变量,并通过两种方式验证模型:在训练时反复留出若干站点分组,以及严格地保留五个完整站点作为外部测试,以评估模型在新地点的表现。
细节地图揭示的内容
最终模型仅使用了八个关键变量,首要的是来自全球天气产品的气温,同时卫星地表温度和湿度也起到了重要作用。模型复现了观测站的读数,平均误差约为0.8 °C,观测与预测之间的匹配度很高。地图显示出明显格局:森林、山地和大型水库上空较冷,而密集的城市中心和高强度建成区则更热,气温较邻近乡村地区高出可达5 °C。模型捕捉到了季节性波动,最热时期为12月至次年3月,最冷为5月至8月。模型在乡村地区的准确性稍逊,并倾向于平滑掉极端的高温和低温日,但它仍优于使用相同输入的传统多元线性回归模型。

这些地图为何与公众健康相关
通过将分散的测量与卫星快照转化为每日街区尺度的温度估算,这项工作为圣保罗及其他城市的公共卫生与城市规划提供了强大的新工具。研究者现在可以研究热如何影响不同社区,包括常常缺席官方记录的非正规住区,并识别在热浪期间居民最易受害的区域。由于该方法完全依赖开放数据和标准软件,它可以推广到其他具备若干地面站和相似卫星覆盖的城市。简言之,这项研究表明我们现在能够以更细致的视角“看见”城市热,为更公平、更有针对性的气候适应措施和脆弱群体保护提供必要基础。
引用: Roca-Barceló, A., Schneider, R., Pirani, M. et al. A satellite based machine learning approach for estimating high resolution daily average air temperature in a megacity in Brazil. Sci Rep 16, 7459 (2026). https://doi.org/10.1038/s41598-026-35689-x
关键词: 城市热岛, 机器学习, 卫星数据, 圣保罗, 气温