Clear Sky Science · it
Migliorare le previsioni di energia eolica e solare mediante l’ingegneria delle caratteristiche delle serie temporali e l’ensemble di machine learning
Perché contano previsioni migliori per le energie pulite
Con l’aumento della quota di elettricità fornita da turbine eoliche e pannelli solari, le loro fluttuazioni naturali rendono più difficile mantenere la continuità del servizio. Gli operatori di rete devono sapere non solo quanta energia viene generata in questo momento, ma anche come è probabile che tale produzione cambi nelle ore successive. Questo studio esplora come analisi dati avanzata e machine learning possano trasformare anni di registrazioni eoliche e solari in previsioni a breve termine più nitide che aiutano a bilanciare domanda e offerta, ridurre gli sprechi e sostenere una rete a basse emissioni più affidabile.
Dalle letture grezze di potenza a segnali più intelligenti
I ricercatori hanno lavorato con quasi sei anni di dati orari di potenza eolica e solare provenienti da tutta la Francia, coprendo oltre cinquanta mila istanti temporali. Invece di inserire questi numeri grezzi direttamente in un modello, li hanno rimodellati in segnali più ricchi. Hanno aggiunto informazioni su quale fosse la produzione un’ora, un giorno o anche più indietro nel tempo, calcolato medie a breve termine e variabilità, e codificato schemi di calendario come ora del giorno, giorno della settimana e stagione usando funzioni circolari che riflettono i cicli giornalieri e annuali. Hanno inoltre verificato con cura informazioni ridondanti e perdite nascoste di dati futuri, affinché i modelli venissero valutati su compiti di previsione realistici e non beneficiassero accidentalmente di avere già le risposte.

Addestrare le macchine a seguire il ritmo del tempo
Con queste serie temporali ingegnerizzate, il team ha testato un’ampia gamma di metodi di previsione. Modelli statistici classici come ARIMA, che assumono schemi lineari relativamente semplici, sono stati confrontati con sistemi di machine learning più flessibili, inclusi gradient boosted decision trees e reti neurali profonde. Due ensemble basati su alberi, CatBoost e LightGBM, si sono distinti. Questi metodi costruiscono molti piccoli alberi decisionali che catturano ciascuno aspetti differenti dei dati e poi li combinano in un singolo predittore potente. Utilizzando uno schema di valutazione rigoroso a scorrimento in avanti, dove ogni nuova previsione è fatta solo a partire da dati passati, gli autori hanno garantito che le prestazioni rispecchiassero quanto ci si potrebbe aspettare nelle operazioni reali di rete.
Fino a che distanza possiamo davvero vedere
Lo studio ha esaminato previsioni dall’ora successiva fino a un intero giorno in avanti, separatamente per eolico e solare. Per l’eolico, i migliori modelli hanno catturato la maggior parte della variazione all’orizzonte di un’ora, con prestazioni che declinano gradualmente all’aumentare del lead time. Fino a circa sei ore, le previsioni mantenevano ancora informazioni utili, ma tra le dodici e le ventiquattro ore la crescente influenza delle condizioni meteorologiche variabili rendeva le previsioni molto meno certe. Il solare si è rivelato ancora più difficile da anticipare su orizzonti lunghi, perché la copertura nuvolosa e altri fattori rapidamente variabili possono cambiare in modi non visibili dalla sola produzione passata. I modelli hanno funzionato bene per l’ora successiva, specialmente nelle giornate limpide, ma oltre poche ore la loro abilità diminuiva nettamente.
A cosa prestano davvero attenzione i modelli
Rimuovendo sistematicamente gruppi di caratteristiche in ingresso, gli autori hanno sondato quali informazioni fossero più importanti. I livelli di potenza recenti — i valori ritardati — sono risultati l’ingrediente dominante, confermando che quanto è appena successo è di solito il miglior indizio per ciò che succederà dopo. Medie mobili e misure di variabilità a breve termine hanno avuto anch’esse un ruolo rilevante, soprattutto quando il sistema era in transizione tra calma e vento o tra nuvoloso e soleggiato. Le caratteristiche di calendario e cicliche, come l’ora del giorno codificata su un cerchio, diventano più importanti per orizzonti più lunghi, dove gli schemi giornalieri e stagionali ampi contano più delle fluttuazioni minuto per minuto. I modelli di deep learning basati su reti ricorrenti potevano seguire oscillazioni complesse nella produzione, ma gli ensemble di alberi meglio ottimizzati pareggiavano o superavano la loro accuratezza con un costo computazionale inferiore.

Cosa significa per la rete del futuro
Per il lettore generale, il messaggio chiave è che una preparazione attenta dei dati con marcatura temporale e una valutazione oculata dei modelli possono fare una reale differenza nella capacità di anticipare la produzione di parchi eolici e solari. Metodi di machine learning sofisticati ma pratici possono fornire previsioni affidabili per le ore successive, che sono la finestra temporale più importante per il bilanciamento quotidiano della rete. Allo stesso tempo, lo studio mostra che guardare un intero giorno avanti resta difficile se ci si affida solo alla produzione passata, specialmente per il solare. Per spingere oltre le previsioni, gli strumenti futuri dovranno combinare queste tecniche guidate dai dati con informazioni meteorologiche dettagliate e conoscenze fisiche su turbine e pannelli, aiutando le reti a rimanere stabili man mano che le energie pulite assumono una quota maggiore del carico.
Citazione: Elmunim, N.A., Khlifi, M.A., Aldawsari, M.A. et al. Enhancing wind and solar energy forecasting through time-series feature engineering and ensemble machine learning. Sci Rep 16, 15546 (2026). https://doi.org/10.1038/s41598-026-49373-7
Parole chiave: previsione energia rinnovabile, predizione potenza eolica, predizione potenza solare, machine learning, caratteristiche delle serie temporali