Clear Sky Science · fr

Prédiction des tendances de température avec intelligence artificielle explicable et apprentissage automatique basé sur l'ACP : étude de cas de Zonguldak, Turquie

· Retour à l’index

Pourquoi les tendances locales de température sont importantes

Pour de nombreuses communautés, le changement climatique peut sembler être une histoire lointaine et globale. Pourtant, ses effets se manifestent le plus clairement dans la météo locale : étés plus chauds, répartition des précipitations modifiée et tempêtes plus intenses. Cette étude se concentre sur Zonguldak, une province côtière et industrielle de la mer Noire occidentale turque, et pose une question pragmatique : l'intelligence artificielle moderne peut-elle non seulement prévoir avec précision les tendances locales de température, mais aussi expliquer comment elle parvient à ces prévisions, afin que les décideurs et les habitants puissent faire confiance aux résultats et les utiliser ?

Transformer les relevés météorologiques bruts en indices exploitables

Pour répondre à cette question, les chercheurs ont rassemblé plus de deux décennies de relevés météorologiques mensuels pour Zonguldak, couvrant les années 2000 à 2022. Le jeu de données comprenait la température moyenne, minimale et maximale de l'air, plusieurs mesures de précipitations, la direction et la vitesse du vent, ainsi que l'humidité. Avant qu'un modèle informatique puisse apprendre à partir de ces données, l'équipe les a nettoyées et standardisées : les valeurs manquantes ont été comblées, les libellés textuels comme les directions du vent ont été convertis en nombres, et toutes les variables ont été mises sur une échelle commune pour qu'aucune mesure ne domine les autres simplement en raison de ses unités.

Distiller des motifs météorologiques complexes

Les données climatiques sont notoirement emmêlées : de nombreuses variables évoluent conjointement et certaines sont fortement corrélées. Pour simplifier ce réseau sans perdre d'information importante, les chercheurs ont utilisé une technique appelée analyse en composantes principales (ACP). Plutôt que d'examiner chaque mesure originale séparément, l'ACP crée un petit nombre de nouveaux facteurs « synthétiques » qui capturent la majeure partie de la variation des données. Dans cette étude, l'équipe a conservé suffisamment de ces facteurs pour préserver 95 % de l'information initiale. Le facteur le plus important, connu comme la première composante principale, s'est avéré combiner température et vent de manière significative : des températures minimales et maximales plus élevées faisaient monter ce facteur, tandis que des vents plus forts le faisaient baisser.

Figure 1
Figure 1.

Choisir les moteurs de prévision les plus fiables

Avec ces facteurs climatiques simplifiés en main, l'équipe a testé une série de méthodes d'apprentissage automatique pour prédire la température moyenne mensuelle. Certaines étaient des modèles linéaires simples ; d'autres, comme les réseaux neuronaux et les arbres boostés, peuvent capturer des relations plus complexes. Les chercheurs ont divisé les données en ensembles d'entraînement et de test et ont évalué chaque méthode avec plusieurs mesures d'erreur et d'ajustement. Malgré l'engouement pour les systèmes complexes « boîte noire », les grands gagnants ici ont été deux approches linéaires simples, appelées régression linéaire et régression ridge. Ces modèles ont systématiquement produit les erreurs les plus faibles et expliqué plus de 90 % de la variation dans les données de test, montrant que, pour cette région et cette échelle temporelle, la température se comporte de façon largement linéaire et prévisible.

Ouvrir la boîte noire des décisions de l'IA

La précision seule ne suffit pas lorsque les prévisions doivent informer les infrastructures, l'agriculture ou la planification sanitaire. Pour comprendre pourquoi les modèles faisaient des prédictions particulières, l'équipe s'est tournée vers des outils d'IA explicable. Ils ont entraîné un modèle basé sur des arbres, bien adapté à ce type d'analyse, et utilisé deux méthodes complémentaires : l'« importance par permutation », qui mesure combien les prédictions se dégradent lorsqu'on mélange un facteur, et les valeurs SHAP, qui attribuent à chaque facteur une contribution à chaque prédiction individuelle. Les deux approches ont raconté la même histoire : la première composante principale dominait les décisions du modèle, avec des rôles secondaires pour quelques autres composantes. En regardant comment ce facteur principal est construit, l'analyse a montré que des conditions plus chaudes (températures minimales et maximales plus élevées) augmentent fortement la température moyenne prédite, tandis que des vents plus rapides tendent à la réduire. L'humidité et les précipitations jouaient des rôles plus modestes.

Figure 2
Figure 2.

Ce que cela signifie pour les habitants et les planificateurs

Concrètement, l'étude montre qu'il est possible de construire des outils de prévision de la température à la fois précis et compréhensibles. Pour Zonguldak, des modèles statistiques simples et bien éprouvés, guidés par des facteurs climatiques soigneusement distillés, ont obtenu des performances aussi bonnes voire meilleures que des systèmes d'IA plus élaborés. Les analyses d'explicabilité ont confirmé que les modèles se comportent de manière physiquement cohérente : ils réagissent fortement aux variations de température et de façon contrebalançante au vent. Cette combinaison de performance et de transparence fait de ce cadre un modèle prometteur pour d'autres régions cherchant à surveiller les tendances climatiques locales et à concevoir des stratégies d'adaptation fondées sur des preuves fiables et interprétables.

Citation: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6

Mots-clés: prévision de la température, changement climatique, apprentissage automatique, IA explicable, analyse en composantes principales