Clear Sky Science · it
Previsione delle tendenze di temperatura con intelligenza artificiale spiegabile e apprendimento automatico basato su PCA: un caso di studio a Zonguldak, Turchia
Perché le tendenze locali della temperatura sono importanti
Per molte comunità, il cambiamento climatico può sembrare una storia lontana e globale. Tuttavia i suoi effetti si manifestano più chiaramente nel clima locale: estati più calde, piogge più irregolari e tempeste più intense. Questo studio si concentra su Zonguldak, una provincia costiera e industriale sul Mar Nero occidentale della Turchia, ponendosi una domanda pratica: le moderne tecniche di intelligenza artificiale possono non solo prevedere accuratamente le tendenze di temperatura locali, ma anche spiegare come arrivano a quelle previsioni, affinché pianificatori e residenti possano fidarsi dei risultati e usarli?
Trasformare registrazioni meteorologiche grezze in indizi utilizzabili
Per affrontare questa domanda, i ricercatori hanno raccolto oltre due decenni di registrazioni meteorologiche mensili per Zonguldak, coprendo gli anni dal 2000 al 2022. Il dataset includeva temperatura dell’aria media, minima e massima, diverse misure di precipitazione, direzione e velocità del vento e umidità. Prima che qualsiasi modello potesse apprendere da questi dati, il team li ha puliti e standardizzati: i valori mancanti sono stati riempiti, etichette testuali come le direzioni del vento sono state convertite in numeri e tutte le variabili sono state portate su una scala comune in modo che nessuna misura dominasse le altre soltanto per via delle sue unità.
Distillare modelli meteorologici complessi
I dati climatici sono notoriamente intrecciati: molte variabili variano insieme e alcune sono fortemente correlate. Per semplificare questa rete senza perdere informazioni importanti, i ricercatori hanno utilizzato una tecnica chiamata analisi delle componenti principali (PCA). Piuttosto che considerare ogni misura originale separatamente, la PCA crea un piccolo numero di nuovi fattori “sintetici” che catturano la maggior parte della variazione nei dati. In questo studio, il team ha mantenuto un numero di fattori sufficiente a preservare il 95 percento delle informazioni originali. Il fattore più importante, noto come prima componente principale, si è rivelato una combinazione significativa di temperatura e vento: temperature minime e massime più alte spingevano verso l’alto questo fattore, mentre venti più forti lo abbassavano.

Scegliere i motori previsionali più affidabili
Con questi fattori climatici semplificati, il team ha testato una serie di metodi di apprendimento automatico per prevedere la temperatura media mensile. Alcuni erano modelli lineari semplici; altri, come reti neurali e alberi potenziati, possono catturare relazioni più complesse. I ricercatori hanno diviso i dati in set di addestramento e di test e hanno valutato ogni metodo con diverse misure di errore e di adattamento. Nonostante l’attenzione attorno ai complessi sistemi “scatola nera”, i vincenti più chiari qui sono stati due approcci lineari semplici, chiamati regressione lineare e regressione ridge. Questi modelli hanno prodotto costantemente gli errori più bassi e hanno spiegato più del 90 percento della variazione nei dati di test, mostrando che, per questa regione e questa scala temporale, la temperatura si comporta in modo in gran parte lineare e prevedibile.
Aprire la scatola nera delle decisioni dell’IA
La precisione da sola non basta quando le previsioni devono informare infrastrutture, agricoltura o pianificazione sanitaria. Per capire perché i modelli facevano specifiche previsioni, il team si è rivolto a strumenti di IA spiegabile. Hanno addestrato un modello basato su alberi ben adatto a questo tipo di analisi e hanno utilizzato due metodi complementari: l’“importanza per permutazione”, che misura quanto peggiorano le previsioni quando un fattore viene mescolato, e i valori SHAP, che assegnano a ciascun fattore un contributo per ogni singola previsione. Entrambi gli approcci hanno indicato la stessa storia: la prima componente principale dominava le decisioni del modello, con ruoli secondari per alcune altre componenti. Guardando a come è costruito questo fattore principale, l’analisi ha mostrato che condizioni più calde (temperature minime e massime più alte) aumentano marcamente la temperatura media prevista, mentre venti più veloci tendono a ridurla. Umidità e precipitazioni hanno avuto ruoli più modesti.

Cosa significa per le persone e i pianificatori
In termini semplici, lo studio dimostra che è possibile costruire strumenti di previsione della temperatura che siano allo stesso tempo accurati e comprensibili. Per Zonguldak, modelli statistici semplici e ben collaudati, guidati da fattori climatici attentamente distillati, hanno funzionato tanto bene quanto o meglio di sistemi di IA più elaborati. Le analisi di spiegabilità hanno confermato che i modelli si comportano in modo fisicamente sensato: rispondono fortemente alle variazioni di temperatura e in modo controbilanciante al vento. Questa combinazione di performance e trasparenza rende il quadro operativo un modello promettente per altre regioni che vogliono monitorare le tendenze climatiche locali e progettare strategie di adattamento basate su evidenze affidabili e interpretabili.
Citazione: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6
Parole chiave: previsione della temperatura, cambiamento climatico, apprendimento automatico, IA spiegabile, analisi delle componenti principali