Clear Sky Science · zh

面向频谱的视觉变换器用于地球系统模型的高保真超分辨率

2026-02-24 · 返回目录

为什么更清晰的气候图很重要

天气和气候决策——诸如规划水库、防洪设施或制定高温应对方案——依赖于观察局部细节：清晰的海岸线、山脊阴影、风暴路径以及热点。然而，大多数全球气候模拟在相对粗糙的网格上运行，会模糊这些微小模式。本文提出了新的人工智能工具，能够将模糊的气候模式输出“锐化”为详细地图，同时以保留那些被常规模型趋向平滑掉但至关重要的微小特征的方式进行。

从模糊的全球模型到清晰的局部视图

地球系统模型模拟了大气、海洋、陆地与冰层的耦合行为，但在非常高空间分辨率下运行这些模型所需的计算代价极高，通常难以实现。因此，许多模拟是在无法解析陡峭温度梯度、强烈通量或对局部风险评估重要的小尺度结构的过粗网格上生成的。一个日益发展的领域称为超分辨率，旨在通过机器学习根据低分辨率输入推断高分辨率场的可能样貌。作者将超分辨率应用于三个关键变量——地表温度、入射短波以及出射长波辐射，使用高分辨率E3SM气候模型的数据，并把任务视为对现有模拟的统计增强，而非物理建模的替代。

针对细节的隐性偏差

大多数现代图像增强工具，包括卷积神经网络和较新的视觉变换器，内在上更容易学习平滑、缓慢变化的模式，而非尖锐边缘和细腻纹理。技术上讲，它们偏好低频内容并难以处理高频信息，而许多重要的气候特征恰好位于高频部分：锋面处陡峭的温度对比、沿海岸线和山地的清晰边界以及局地极端。早期采用正弦（波状）激活的特殊神经网络表明这种偏差可以减弱，但现成方法并未针对气候数据的多尺度、物理结构进行定制。本文指出这种“谱偏差”是将通用视觉模型用于气候超分辨率时的主要障碍。

一种让 AI 学会气候尺度的新方法

为了解决这个问题，作者提出了两个相关模型，ViSIR 和 ViFOR，将频率感知直接嵌入视觉变换器管线。ViSIR（视觉变换器调谐的正弦隐式表示）使用变换器从粗糙的气候图中捕捉全局上下文，然后将这些信息传入由正弦单元构建的解码器，后者能够更忠实地表示高频模式。该解码器是“隐式的”，意味着它可以在任意坐标处生成值，从而允许灵活的输出分辨率。ViFOR（视觉变换器傅里叶表示网络）进一步推进了这一思路，使用基于傅里叶的滤波器将信息明确地分离为低频和高频通道，然后再重组。这样模型可以分别学习平滑的背景模式和尖锐细节，而不是强制单一设置适用于所有尺度和变量。

新模型在实践中的表现

研究人员在数十年每月一次的 E3SM 模拟上训练并测试其方法，这些模拟同时提供粗分辨率和细分辨率版本。他们将 ViSIR 和 ViFOR 与经典卷积网络、一个生成模型、基础视觉变换器、一个领先的变换器修复模型以及不带变换器的正弦网络进行了比较。在地表温度以及短波和长波辐射三个变量上，新模型带来了更小的误差和与细分辨率参考更高的相似度，其中 ViFOR 始终位居前列。信号质量提高若干分贝对应于更清晰的梯度和更忠实的小尺度结构。谱分析显示 ViFOR 不仅恢复了更多高频能量，而且以受控的方式进行，避免了虚假的噪声并保持了各尺度间的正确平衡。当模型在全局整图上训练而非裁剪区域时，益处尤其明显，这强调了保留大尺度气候背景的重要性。

这对气候决策意味着什么

通俗地说，ViSIR 尤其是 ViFOR 是用于气候图的一种专用显微镜：它们将模糊的全球图像作为输入，在尊重真实气候场跨尺度变化的前提下，统计性地填补缺失的细节。它们并不发明新的物理规律，也不替代高分辨率模拟或区域模型。相反，它们作为智能的后处理工具，使现有的粗分辨率模拟对地球观测、危险图绘和规划更有用。通过直接应对常规模型抹除锐利特征的倾向，这些频率感知的变换器为气候科学家和从业者提供了来自他们已有模拟的更清晰、更可靠的空间细节，有助于缩小全球模型与地方决策之间的差距。

引用: Zeraatkar, E., Faroughi, S.A. & Tešić, J. Frequency-aware vision transformers for high-fidelity super-resolution of Earth system models. Sci Rep 16, 10363 (2026). https://doi.org/10.1038/s41598-026-41020-5

关键词: 气候超分辨率, 地球系统模型, 视觉变换器, 频率感知人工智能, 降尺度