Clear Sky Science · fr

Prédiction des particules en suspension (PM2.5 et PM10) par décomposition en séries de Fourier combinée à LSTM et SVM

· Retour à l’index

Pourquoi des prévisions d’air plus propres importent à tous

Les particules fines dans l’air constituent une menace invisible que nous respirons chaque jour. De minuscules particules appelées PM2,5 et PM10 peuvent pénétrer profondément dans nos poumons et notre circulation sanguine, augmentant le risque de maladies cardiaques et respiratoires. Pourtant, les niveaux de pollution peuvent varier fortement d’une heure à l’autre. Cette étude examine comment prévoir ces fluctuations plus précisément, heure par heure et saison par saison, dans une ville portuaire marocaine animée — afin que les autorités puissent alerter les habitants et planifier des actions avant que l’air ne devienne dangereux.

Figure 1
Figure 1.

Comprendre la poussière dans l’air urbain

Les chercheurs se sont concentrés sur Mohammedia, une ville de la côte Atlantique qui abrite une raffinerie et des zones industrielles, ce qui en fait un terrain d’essai utile pour la science de la qualité de l’air. Ils ont étudié deux types courants de particules en suspension : les PM2,5, les particules les plus fines d’un diamètre inférieur ou égal à 2,5 micromètres, et les PM10, des particules un peu plus grosses allant jusqu’à 10 micromètres. Les deux restent en suspension dans l’air et sont connues pour être parmi les polluants les plus nocifs pour la santé humaine. L’équipe a collecté des mesures horaires de ces particules de décembre 2020 à novembre 2021, créant un enregistrement détaillé des hausses et des baisses de pollution sur des jours, des semaines et des saisons.

Nettoyer des données réelles souvent désordonnées

Comme la plupart des systèmes de surveillance réels, les instruments de la ville n’ont pas fourni de données parfaites. Certaines heures manquaient à cause de défaillances de capteurs ou de problèmes de communication, et les distributions présentaient parfois des pointes extrêmes. Plutôt que de combler simplement les lacunes par des interpolations linéaires qui pourraient estomper de véritables pics de pollution, les auteurs ont utilisé une méthode consciente des saisons. Ils ont d’abord capturé les schémas quotidiens réguliers — comme des niveaux plus élevés aux heures de fort trafic — puis n’ont lissé que la partie irrégulière restante du signal en utilisant un lissage local. Ils ont également séparé les motifs répétitifs à plusieurs échelles temporelles (jour, semaine, année) et ont employé une technique de détection d’anomalies pour repérer et corriger les valeurs aberrantes suspectes. Ce nettoyage minutieux visait à préserver les événements de pollution réels tout en éliminant le bruit.

Laisser les mathématiques et les machines partager le travail

Au cœur de l’étude se trouve un mariage entre mathématiques classiques et intelligence artificielle moderne. Les auteurs ont utilisé les séries de Fourier, un outil qui décompose une courbe complexe en une somme d’ondes simples, pour décomposer les séries temporelles de pollution en tendance, cycles saisonniers et fluctuations résiduelles. Ils ont ensuite entraîné deux modèles d’apprentissage automatique populaires sur ces signaux traités : les machines à vecteurs de support (SVM), qui repèrent des motifs dans les données via des frontières flexibles, et les réseaux de mémoire longue à court terme (LSTM), un type de réseau neuronal conçu pour apprendre à partir de séquences temporelles. Des versions de chaque modèle avec prétraitement basé sur Fourier (SVMF et LSTMF) ont été comparées à des versions entraînées uniquement sur les données brutes.

Figure 2
Figure 2.

Ce que révèlent les motifs saisonniers

Les enregistrements horaires ont révélé des rythmes saisonniers distincts dans l’air de Mohammedia. Pour les PM2,5, l’automne affichait les niveaux moyens les plus élevés, avec des pics prolongés en soirée et la nuit s’étendant d’environ 19h à 2h du matin, probablement liés au trafic, au commerce et aux activités sociales. L’hiver et l’été montraient également de forts pics en soirée et tard la nuit, tandis que le printemps présentait deux principales poussées : une en début d’après‑midi et une autre en soirée. Les PM10 suivaient des schémas globalement similaires, avec des pics marqués en soirée et des niveaux diurnes plutôt plus faibles pour la plupart des saisons. Ces motifs soulignent que les pires épisodes de pollution coïncident souvent avec des périodes où de nombreuses personnes sont à l’extérieur ou en déplacement.

Des prévisions plus nettes grâce à la décomposition

Sur les quatre saisons et pour les deux polluants, les modèles hybrides combinant décomposition de Fourier et apprentissage automatique ont clairement surpassé les modèles entraînés sur les données brutes. Le modèle LSTMF, qui associe LSTM et prétraitement basé sur Fourier, a été systématiquement le meilleur. Pour les prévisions horaires, sa précision a atteint les meilleurs classements dans chaque saison, avec des résultats particulièrement solides en automne. Lorsque l’équipe a étendu l’horizon pour prédire jusqu’à sept jours à l’avance, LSTMF a conservé une grande performance, avec des coefficients de détermination (R²) proches ou supérieurs à 0,9 dans de nombreux cas. En termes simples, la décomposition du signal a aidé les modèles à se concentrer sur les structures significatives — tendances à long terme et cycles récurrents — tout en mieux gérant le bruit à court terme.

Ce que cela signifie pour la vie quotidienne

Pour les non-spécialistes, le message clé est qu’une prévision plus intelligente peut transformer des données brutes de capteurs en protection concrète. En prédisant plus précisément les niveaux horaires de PM2,5 et PM10, les urbanistes et les agences de santé peuvent anticiper les pics de pollution et alerter les personnes souffrant de problèmes respiratoires, ajuster la circulation ou programmer des restrictions industrielles. Bien que cette étude n’ait porté que sur une ville marocaine et n’ait utilisé que des mesures passées de particules (sans ajouter de données météo ou d’émissions), elle montre que combiner l’apprentissage profond avec une décomposition mathématique est une recette puissante pour des prévisions de qualité de l’air plus propres et plus fiables. Avec des améliorations supplémentaires et une extension à d’autres lieux, de tels outils pourraient soutenir des systèmes d’alerte précoce aidant les gens à respirer un peu mieux au quotidien.

Citation: Bennis, M., Youssfi, M., Morabet, R.E. et al. Particulate matter (PM2.5 and PM10) prediction using fourier series decomposition in combination with LSTM and SVM. Sci Rep 16, 7665 (2026). https://doi.org/10.1038/s41598-026-38436-4

Mots-clés: prévision de la pollution de l’air, particules en suspension, apprentissage automatique, décomposition de Fourier, qualité de l’air urbain