Clear Sky Science · fr

Analyse de l’importance des variables basée sur la corrélation pour améliorer les prédictions de stabilité par apprentissage automatique dans les systèmes photovoltaïques hybrides

· Retour à l’index

Pourquoi maintenir une alimentation stable devient plus difficile

À mesure que davantage de foyers et d’entreprises utilisent l’énergie solaire, assurer la stabilité du réseau électrique devient plus délicat. Le passage de nuages sur les panneaux ou des variations soudaines de la demande peuvent faire fluctuer les tensions d’une manière que les méthodes de contrôle traditionnelles n’avaient pas prévue. Cet article examine comment l’apprentissage automatique moderne peut jouer le rôle d’un système d’alerte précoce pour de telles perturbations, en prédisant à la fois la tension du réseau et la stabilité globale dans des systèmes hybrides qui combinent solaire et sources conventionnelles.

Figure 1
Figure 1.

Comment un jumeau numérique d’un réseau solaire a été construit

Plutôt que de s’appuyer sur des mesures de terrain bruyantes ou incomplètes, les auteurs ont d’abord créé un « jumeau numérique » détaillé d’un microréseau raccordé au réseau sous MATLAB/Simulink. Ce système virtuel comprend des panneaux solaires, un onduleur électronique qui les relie au réseau, et des charges clients dépendant de la tension et de la fréquence. En faisant varier systématiquement l’ensoleillement, la température, la demande de charge et les conditions de fonctionnement de l’onduleur, ils ont généré 500 scénarios de fonctionnement réalistes. Pour chacun, le modèle enregistre le courant et la tension du réseau ainsi qu’un score composite de stabilité qui reflète la capacité du système à traverser les perturbations, la qualité du contrôle de la tension et de la fréquence, et le degré de proximité des limites de l’onduleur.

Transformer des signaux bruts en indices utiles

À partir de ces simulations, six signaux clés ont été retenus comme entrées pour la prédiction : température ambiante, irradiance solaire, niveau de charge, tension du DC-link, puissance de sortie de l’onduleur et courant du réseau. L’équipe a normalisé et nettoyé les données, éliminé les valeurs aberrantes, puis utilisé une idée simple mais efficace pour mettre en avant ce qui compte : le pondération des caractéristiques basée sur la corrélation. Pour chaque entrée, ils ont mesuré dans quelle mesure elle évolue avec les sorties cibles, la tension du réseau et le score de stabilité. Les variables ayant des liens plus forts se sont vues attribuer des poids supérieurs avant l’entraînement des modèles. Cette étape n’invente pas de nouvelles données, mais oriente le processus d’apprentissage pour accorder plus d’attention aux variables physiquement importantes comme le courant du réseau et la tension du DC-link.

Figure 2
Figure 2.

Mise à l’épreuve de cinq algorithmes d’apprentissage

Avec l’ensemble de données pondéré en main, les auteurs ont comparé cinq approches d’apprentissage automatique populaires : Random Forests, Extra Trees, Support Vector Regression, CatBoost et Gradient Boosting. Tous les modèles ont été entraînés et testés dans les mêmes conditions, avec une répartition 80:20 des données et un jeu commun de mesures de précision. Ces mesures incluaient le coefficient de détermination (part de la variance expliquée) et plusieurs scores d’erreur prenant en compte à la fois les erreurs moyennes et leur dispersion. L’étude est allée au-delà des simples indicateurs globaux en examinant la distribution temporelle des erreurs et la fréquence à laquelle les prédictions restaient dans des bandes de tolérance strictes.

Pourquoi le gradient boosting s’est démarqué

Le Gradient Boosting, qui construit une séquence de modèles simples corrigeant chacun les erreurs des précédents, a systématiquement fourni les prédictions les plus précises et les plus fiables. Pour la tension du réseau, il a reproduit les valeurs mesurées de très près, avec un R² de test d’environ 0,98 et des erreurs en pourcentage typiques de l’ordre d’un quart de pourcent ; environ 95 % des erreurs de tension restaient dans une demi-volt. Pour le score de stabilité, il arrivait encore en tête, capturant plus de 93 % de la variance avec des erreurs moyennes inférieures à une unité. Lorsque les pondérations basées sur la corrélation ont été appliquées, sa précision s’est encore améliorée, en particulier pour la prédiction de la stabilité, et la distribution de ses erreurs est devenue plus étroite et plus uniforme que celle des modèles concurrents. Cela indique non seulement de bonnes performances moyennes, mais aussi un comportement fiable en conditions calmes comme en conditions changeantes rapides.

Ce que cela signifie pour les réseaux futurs riches en solaire

Pour les non-spécialistes, le message clé est que des outils d’apprentissage automatique conçus avec soin peuvent offrir aux opérateurs de réseau un aperçu fiable du comportement d’un système à forte pénétration solaire dans les prochaines minutes. En combinant un jumeau numérique fondé sur la physique, une analyse de corrélation simple et une méthode d’ensemble robuste comme le Gradient Boosting, le cadre peut signaler quand les tensions risquent de dériver ou quand la marge de stabilité du système diminue. Cela permet d’ajuster plus intelligemment les paramètres des onduleurs, d’utiliser mieux la puissance réactive et d’orienter plus précisément la maintenance, réduisant à la fois les coupures et les réductions inutiles de production propre. En substance, l’étude montre qu’ajouter une couche interprétable d’intelligence statistique aux commandes matérielles existantes peut rendre les réseaux riches en renouvelables plus résilients, plus efficaces et plus faciles à gérer.

Citation: Swarnkar, V., Ralhan, S., Singh, M. et al. Correlation based feature importance analysis for improving machine learning stability predictions in hybrid PV systems. Sci Rep 16, 10041 (2026). https://doi.org/10.1038/s41598-026-37270-y

Mots-clés: systèmes photovoltaïques hybrides, prédiction de la tension du réseau, apprentissage automatique pour les réseaux électriques, gradient boosting, stabilité des réseaux renouvelables