Clear Sky Science · fr

Prévision temporelle explicable avec SHAP sans échantillonnage pour les Transformers

· Retour à l’index

Pourquoi les prévisions intelligentes doivent être comprises

De la planification du réseau électrique à la fixation des prix de l’électricité de demain, de nombreuses décisions reposent sur des modèles informatiques qui prédisent l’évolution de quantités au fil du temps. Ces modèles sont devenus extrêmement puissants, mais aussi plus difficiles à comprendre, ce qui peut rendre les acteurs réticents à leur faire confiance dans des domaines critiques comme les systèmes énergétiques. Cet article présente SHAPformer, une approche de prévision qui non seulement produit des prédictions précises, mais montre aussi clairement quelles informations passées ont le plus influencé chaque prévision.

Comment la prévision peut devenir une boîte noire

La prévision moderne de séries temporelles utilise souvent l’apprentissage profond, en particulier les modèles Transformer initialement conçus pour la traduction automatique. Ils peuvent traiter de nombreux intrants, comme la demande électrique passée, la météo et les informations calendaires, et apprendre des motifs complexes à partir de vastes jeux de données. Pourtant, leur fonctionnement interne reste largement caché, si bien que les utilisateurs ne peuvent pas facilement comprendre pourquoi une prédiction particulière a été émise. Ce manque de transparence est problématique en pratique, car les opérateurs de réseau, les régulateurs et les entreprises exigent de plus en plus des explications avant de s’appuyer sur des sorties de modèle susceptibles d’affecter les coûts, la sécurité ou la conformité.

Une manière de partager équitablement le crédit entre les entrées

Une famille populaire d’outils d’explication se fonde sur l’idée de partager équitablement le « crédit » entre les entrées. Dans cette optique, chaque caractéristique, comme la demande d’hier ou la température d’aujourd’hui, est traitée comme un joueur dans un jeu coopératif, et la prédiction du modèle est le résultat de ce jeu. Les méthodes basées sur Shapley, regroupées sous le nom SHAP, estiment la contribution moyenne de chaque caractéristique en comparant les prédictions avec et sans cette caractéristique. Les outils SHAP existants pour les séries temporelles reposent cependant généralement sur l’échantillonnage de nombreux exemples artificiels ou sur le remplacement des entrées manquantes par des valeurs de référence, ce qui peut être lent et générer des scénarios irréalistes qui faussent l’explication.

Le nouveau chemin court de SHAPformer vers des réponses claires

SHAPformer reconfigure le modèle de prévision lui-même pour que les explications en émergent naturellement, sans échantillonnage intensif. Il regroupe les entrées liées, par exemple toutes les valeurs d’un même jour ou toutes les observations d’une variable météorologique, et entraîne le Transformer à fonctionner même lorsque certains de ces groupes sont délibérément masqués. Grâce à une technique appelée manipulation de l’attention, le modèle peut activer ou désactiver proprement des groupes de caractéristiques lors de la génération d’une prévision. Cela rend possible le calcul exact des contributions au sens SHAP en évaluant directement toutes les combinaisons de ces groupes, plutôt qu’en les approximant par des échantillons aléatoires. Le résultat est un modèle qui peut expliquer une prévision unique en moins d’une seconde, soit un gain de vitesse d’environ 50 à 1000 fois par rapport à une méthode SHAP basée sur l’échantillonnage largement utilisée.

Figure 1. Comment la demande passée, les signaux météo et calendaires alimentent un modèle interprétable pour prévoir la consommation électrique future.
Figure 1. Comment la demande passée, les signaux météo et calendaires alimentent un modèle interprétable pour prévoir la consommation électrique future.

Vérifier les explications par rapport à une vérité connue

Pour tester si les explications de SHAPformer sont dignes de confiance, les auteurs ont d’abord construit un jeu de données synthétique où les règles générant les données sont entièrement connues. Ils ont ensuite utilisé ces règles pour dériver une « vérité de référence » sur l’importance que chaque entrée devrait avoir et sur la façon dont elle devrait précisément affecter la prévision. Les explications de SHAPformer correspondaient étroitement à cette vérité de référence, tant en termes d’importance globale que de motifs détaillés, par exemple la réduction de la demande pendant les jours fériés ou la modification des courbes journalières le week-end. Les méthodes concurrentes évaluaient soit mal quelles caractéristiques étaient les plus importantes, soit produisaient des explications plus bruitées et inconsistantes.

Ce que le modèle révèle sur des données énergétiques réelles

Ensuite, SHAPformer a été appliqué à des données réelles de consommation électrique d’un gestionnaire de réseau de transport allemand et aux prix de l’électricité jour-ahead dans une zone de marché européenne. Dans le cas de la charge, le modèle a confirmé que l’intrant le plus influent est la charge une semaine plus tôt, suivi par le jour de la semaine et l’heure de la journée, la température, le mois et les jours fériés jouant également des rôles nets mais moindres. Il a capturé des motifs intuitifs, comme des charges plus faibles le week-end, une activité réduite autour de Noël et une demande plus élevée les jours froids. Pour les prix de l’électricité, le modèle a mis en évidence les prix passés et les motifs selon l’heure de la journée, mais a aussi montré comment une production éolienne et solaire plus forte tend à faire baisser les prix, en accord avec les attentes économiques.

Figure 2. Comment le masquage de groupes d’entrées dans un transformer révèle l’influence de chaque groupe sur les prévisions horaires d’énergie.
Figure 2. Comment le masquage de groupes d’entrées dans un transformer révèle l’influence de chaque groupe sur les prévisions horaires d’énergie.

Pourquoi ces enseignements sont importants

SHAPformer démontre qu’il est possible de concevoir des modèles de prévision à la fois performants et transparents quant à leurs raisons. Plutôt que de traiter les explications comme un supplément coûteux, la méthode les intègre à la conception du Transformer de sorte que chaque prédiction s’accompagne d’une ventilation rapide et fidèle des facteurs qui l’ont motivée. Pour les décideurs dans l’énergie et d’autres secteurs sensibles au temps, cela signifie qu’ils peuvent voir non seulement ce que le modèle prévoit, mais aussi pourquoi, ce qui favorise un meilleur jugement, une plus grande transparence réglementaire et une utilisation plus éclairée des outils d’IA avancés.

Citation: Hertel, M., Pütz, S., Mikut, R. et al. Explainable time-series forecasting with sampling-free SHAP for Transformers. Nat Commun 17, 4723 (2026). https://doi.org/10.1038/s41467-026-73243-5

Mots-clés: prévision de séries temporelles, IA explicable, modèles Transformer, charge électrique, valeurs SHAP