Clear Sky Science · zh

将多任务学习与可微分物理约束框架相结合用于水文预报

2026-03-17 · 返回目录

更智能的水情预报为何重要

农民、城市规划者和灾害管理人员都依赖于了解水如何在土壤中流动并返回大气。然而预测这一拼图中的关键部分——例如不同深度土壤的湿度以及水蒸发回大气的速率——仍然令人意外地困难。传统的基于物理的模型在面对真实地貌的混乱复杂性时常常力不从心，而现代人工智能尽管可能精确，却经常忽视基本的自然定律。本研究提出了一种融合两者的新方法，旨在使水文预报不仅更精确，而且在物理上更值得信赖。

同时关联多个水文信号

水文学中大多数深度学习系统通常只训练来预测单一目标——例如仅预测土壤含水量或仅预测地面到空气的蒸散发。但在现实世界中这些变量紧密相关：土壤中的水量影响能蒸发多少，而蒸发反过来又改变土壤含水量。作者构建了一个多任务学习模型，同时预测若干相关变量：三个深度层的土壤含水量和蒸散发。该模型使用一个循环神经网络（LSTM），输入一年每日的气象数据，如降水、温度、太阳辐射和风速，以及有关当地土壤和植被的信息。一个共享的核心网络学习普遍模式，而几个较小的输出分支则专门化用于各个变量。

教模型尊重水量守恒

为了超越纯数据驱动的方法，研究者将一个简单但强有力的物理规则嵌入其中：水量平衡。在给定时期内，来自降水的入流必须通过径流和蒸散发的出流来解释，再加上土壤含水量等储水量的变化以及其他较小的过程。他们并非把这个方程作为外部检验，而是直接把它构建进模型的训练过程中。神经网络对土壤含水量和蒸散发的预测若违反水量平衡，就会受到惩罚，从而推动系统朝向总体上守水的解。

让网络学习那些缺失的环节

真实的地貌包含许多难以精确定义的水路径，包括融雪、地下水交换以及被植物和建筑拦截的水。这些过程因地点而异，且难以用固定公式来编码。作者通过在水量平衡方程中插入第二个神经网络来表示“残差”项——那些难以捕捉的剩余部分。这个嵌入网络接受相同的气象和陆面输入，并在没有直接监督的情况下学习估计这些缺失过程，从而使整体水预算闭合。由于系统的所有部分都是可微的，主预测器与该残差网络能够在一个端到端框架中共同训练。

在全球范围内测试性能

研究团队使用 LandBench 1.0 数据集评估他们的方法，该数据集将数十年全球气象与陆面信息以日分辨率整合在一起。首先，他们将多任务模型与四个独立的单任务网络进行比较。一次预测多个变量被证明是有益的：浅层和更深层的土壤含水量预测都有所改善，蒸散发在捕捉变异性和偏差方面也更为一致。接着，他们测试了三种多任务设置：一种没有物理约束，一种基于固定水量平衡公式的简单惩罚，以及他们新的可微分物理约束框架。简单的惩罚常常损害性能，表明僵化但不完善的物理约束会误导学习。相比之下，可微分框架通常在土壤含水量（尤其是更深层）上取得最佳得分，并在蒸散发方面带来适度提升。

对干旱地区和罕见事件的益处

当训练数据有限或条件极端时，新框架的一大优势会显现。当作者大幅减少训练数据量时，无约束模型的预测变得分散且有偏差，而受物理约束的版本在所有深度的土壤含水量上更接近现实。该方法也改善了对非常低土壤含水量和蒸散发值的预测——这些条件通常与干旱相关。在北非和中东等干旱地区，模型更好地捕捉到蒸发受限于稀缺土壤水分的行为，这是纯统计模型常常无法表现出的。能量驱动的高强度蒸散发极端情况仍然具有挑战性，表明未来工作需要加入能量平衡方程。

这对未来水情预报意味着什么

对非专业读者而言，主要信息是作者创建了一个既能从海量数据中学习又仍然“记得”水不能无缘无故出现或消失的预报系统。通过将一个多输出神经网络直接与水量平衡相联系，并允许其学习水文循环中模糊且难以建模的部分，他们在多种气候条件下实现了更准确、更稳健的预测，尤其在观测稀少或条件异常时。这类可微分的、具有物理意识的学习为开发水文工具提供了一个有前景的路径，使科学家、决策者和公众能够信赖这些工具在未来情形不同于过去时仍能表现合理。

引用: Yan, Y., Yu, Z., Zhu, J. et al. Integrating multi-task learning with a differentiable physics constrained framework for hydrological forecasting. Sci Rep 16, 13824 (2026). https://doi.org/10.1038/s41598-026-41277-w

关键词: 水文预报, 土壤含水量, 蒸散发, 物理知情人工智能, 多任务学习