Clear Sky Science · fr

SuryaBench : Jeu de données de référence pour faire progresser l’apprentissage automatique en héliophysique et prévision du temps spatial

· Retour à l’index

Pourquoi le déluge de données solaires compte

Notre monde technologique dépend discrètement des humeurs du Soleil. Les tempêtes solaires peuvent perturber le GPS, les liaisons radio et même les réseaux électriques. L’observatoire SDO (Solar Dynamics Observatory) de la NASA a passé plus d’une décennie à observer le Soleil avec une grande finesse, mais le volume et la complexité de ces images rendent leur exploitation difficile à grande échelle. Cet article présente SuryaBench, une collection soigneusement préparée de données solaires conçue pour que les outils d’intelligence artificielle modernes apprennent à « lire » le Soleil et nous aident à prévoir le temps spatial de manière plus fiable.

Une image plus claire de notre étoile active

SuryaBench part du flux brut d’images et de mesures capturées par le SDO depuis 2010. Un instrument enregistre la lumière d’un gaz solaire très chaud situé au‑dessus de la surface, tandis qu’un autre cartographie les champs magnétiques et les mouvements à la surface elle‑même. Les auteurs alignent, nettoient et standardisent ces images afin que le disque solaire apparaisse toujours au même endroit, avec la même taille et la même netteté, en corrigeant les variations liées à l’orbite du satellite ou au vieillissement des caméras. Le résultat est une vue unifiée du Soleil, à la résolution originale complète, répétée toutes les 12 minutes sur presque un cycle solaire de 11 ans.

Figure 1. Comment des vues détaillées du Soleil alimentent des systèmes d’IA qui contribuent à protéger les satellites, les réseaux électriques et les communications sur Terre.
Figure 1. Comment des vues détaillées du Soleil alimentent des systèmes d’IA qui contribuent à protéger les satellites, les réseaux électriques et les communications sur Terre.

Des mesures désordonnées aux données prêtes pour les machines

Transformer ce trésor brut en matériau exploitable par des ordinateurs nécessite de nombreuses étapes soignées. L’équipe corrige la rotation et le pointage du satellite, ajuste les temps d’exposition pour traiter équitablement les éléments brillants et faibles, et compense l’usure progressive des détecteurs. Ils réunissent également des images provenant d’instruments distincts pour que les structures observées dans le gaz incandescent coïncident exactement avec les motifs magnétiques qui les façonnent. De plus, ils normalisent la taille apparente du disque solaire, qui varierait autrement avec la distance du satellite au Soleil. Ces choix éliminent des distractions qui perturberaient les algorithmes d’apprentissage et leur permettent de se concentrer sur le comportement solaire réel.

Des défis intégrés pour des modèles intelligents

Plutôt que de fournir de simples images nettoyées, SuryaBench inclut aussi six « jeux de défis » prêts à l’emploi qui incarnent des questions clés en recherche solaire et en météorologie spatiale. L’un porte sur l’identification de zones magnétiquement actives à la surface solaire, un autre sur la détection de signes subtils annonçant l’émergence d’une telle région, et un troisième sur la mise en relation du magnétisme de surface avec les lignes de champ bouclées dans la couronne. D’autres relient les images solaires à des événements ayant des conséquences près de la Terre, comme des rafales de rayons X appelées éruptions solaires, des variations du vent solaire atteignant la Terre, et des fluctuations du rayonnement ultraviolet extrême du Soleil qui affectent la haute atmosphère et la traînée des satellites. Chaque tâche est fournie avec des découpages de données standard et des modèles d’apprentissage automatique exemples, afin que les chercheurs puissent comparer les méthodes sur un pied d’égalité.

Figure 2. Comment des images solaires nettoyées et alignées alimentent, étape par étape, des tâches d’IA qui prévoient les éruptions, le vent solaire et l’activité magnétique.
Figure 2. Comment des images solaires nettoyées et alignées alimentent, étape par étape, des tâches d’IA qui prévoient les éruptions, le vent solaire et l’activité magnétique.

Tester les outils d’aujourd’hui sur les tempêtes de demain

Pour illustrer l’utilisation de SuryaBench, les auteurs entraînent une variété de modèles profonds populaires sur plusieurs de ces tâches. Ils montrent qu’un réseau neuronal moderne peut déjà apprendre à prédire des images solaires futures avec une bonne fidélité et peut s’attaquer à des problèmes tels que la segmentation des régions actives, l’estimation de la vitesse du vent solaire et la classification des éruptions puissantes. Les performances varient selon la tâche et la famille de modèles, soulignant à la fois le potentiel des approches basées sur les données et le besoin d’innovations supplémentaires. En publiant des mesures d’exactitude communes et en partageant le code, le projet établit une référence solide pour les travaux futurs.

Ce que cela signifie pour la vie sur Terre

En termes pratiques, SuryaBench vise moins à fournir aujourd’hui une prévision parfaite qu’à offrir à la communauté un terrain d’entraînement partagé et de haute qualité pour en construire de meilleures demain. En empaquetant des années d’observations solaires soigneusement nettoyées avec des problèmes de prédiction bien définis, le jeu de données abaisse la barrière pour la collaboration entre physiciens solaires et experts en apprentissage automatique. À mesure que les modèles s’améliorent, nous pouvons attendre des orientations plus régulières sur les moments où le Soleil est susceptible de perturber nos systèmes spatiaux et terrestres. Pour le grand public, cet effort nous rapproche d’un traitement du temps spatial un peu comme celui de la météo ordinaire : quelque chose que l’on peut suivre, anticiper et contre lequel se préparer avec une confiance croissante.

Citation: Roy, S., Hegde, D.V., Schmude, J. et al. SuryaBench: Benchmark Dataset for Advancing Machine Learning in Heliophysics and Space Weather Prediction. Sci Data 13, 712 (2026). https://doi.org/10.1038/s41597-026-06552-5

Mots-clés: temps spatial, éruptions solaires, héliophysique, apprentissage automatique, vent solaire