Clear Sky Science · zh

基于可解释人工智能与主成分分析的气温趋势预测:以土耳其宗古尔达克为例

· 返回目录

为何地方气温趋势很重要

对许多社区来说,气候变化可能感觉像是遥远的全球性话题,但其影响最清晰地体现在本地天气:更炎热的夏季、降雨模式的变化以及更强烈的风暴。该研究聚焦于宗古尔达克——土耳其西黑海沿岸的一个沿海工业省,提出了一个务实的问题:现代人工智能能否不仅准确预测当地的气温趋势,还能解释其做出这些预测的原因,以便规划者和居民可以信任并利用这些结果?

把原始气象记录转化为可用线索

为了解答这个问题,研究人员收集了宗古尔达克超过二十年的月度气象记录,覆盖2000年至2022年。数据集包括平均、最低和最高气温、若干降雨指标、风向与风速以及湿度。任何计算模型在学习这些数据之前,团队都对其进行了清洗与标准化:填补缺失值、将诸如风向的文本标签转换为数字,并将所有变量置于共同尺度上,避免某个测量仅因单位不同而主导模型。

提取复杂天气模式的要点

气候数据通常错综复杂:许多变量会一起变化,有些变量之间存在强关联。为了在不丢失重要信息的前提下简化这种网络,研究人员采用了称为主成分分析(PCA)的技术。PCA并非单独查看每个原始测量值,而是构建少量新的“摘要”因子,捕捉数据中大部分的变异。在本研究中,团队保留了足以保存95%原始信息的主成分。最重要的因子,即第一主成分,恰当地将温度与风力结合起来:更高的最低和最高温度会提升该因子,而更强的风则使其下降。

Figure 1
Figure 1.

挑选最可靠的预测引擎

在这些简化后的气候因子基础上,团队测试了一系列机器学习方法来预测月平均气温。有些方法是简单的线性模型;另一些如神经网络和提升树则能捕捉更复杂的关系。研究人员将数据分为训练集与测试集,并用多种误差和拟合度量评估每种方法。尽管复杂“黑箱”系统备受关注,但这里的明显赢家是两种直接的线性方法:线性回归和岭回归。这些模型持续产生最低的误差,并在测试数据上解释了超过90%的变异,表明在该地区和该时间尺度上,气温在很大程度上呈线性、可预测的行为。

打开人工智能决策的黑箱

仅有准确性不足以满足用于基础设施、农业或健康规划的预测需求。为了解模型为何做出特定预测,团队转向可解释人工智能工具。他们训练了一个适合此类分析的基于树的模型,并使用了两种互补的方法:“置换重要性”(衡量当某个因子被打乱时预测恶化的程度)以及SHAP值(为每个因子赋予对每一次单独预测的贡献)。两种方法都指向同一结论:第一主成分主导了模型决策,其他少数主成分起次要作用。回溯该主导因子的构成,分析显示更温暖的条件(更高的最低和最高气温)会显著抬高预测的平均气温,而更快的风速则倾向于抑制它。湿度和降雨的作用则较为温和。

Figure 2
Figure 2.

这对民众与规划者意味着什么

简而言之,该研究表明可以构建既准确又可理解的气温预测工具。对于宗古尔达克而言,经过精心提炼的气候因子指导下的简单、经验证的统计模型,其表现不逊于甚至优于更复杂的人工智能系统。可解释性分析证实了这些模型在物理上是合理的:它们对温度变化反应强烈,并以与风相互制衡的方式响应。性能与透明度的结合使该框架成为其他地区监测局部气候趋势并基于可靠、可解释的证据制定适应策略的有前景的蓝图。

引用: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6

关键词: 气温预测, 气候变化, 机器学习, 可解释人工智能, 主成分分析