Clear Sky Science · ru
Прогнозирование твердых частиц (PM2.5 и PM10) с использованием разложения в ряд Фурье в сочетании с LSTM и SVM
Почему прогнозы чистого воздуха важны для всех
Мелкая пыль в воздухе — невидимая угроза, которую мы вдыхаем каждый день. Крошечные частицы, называемые PM2.5 и PM10, могут проникать глубоко в легкие и кровоток, повышая риск заболеваний сердца и легких. При этом уровень загрязнения может резко меняться из часа в час. В этом исследовании изучается, как точнее прогнозировать такие колебания по часам и по сезонам в оживленном марокканском портовом городе — чтобы власти могли предупреждать жителей и планировать меры до того, как воздух станет опасным.

Понимание пыли в городском воздухе
Авторы сосредоточились на Мохаммедии, приатлантическом городе, в котором есть нефтеперерабатывающий завод и промышленные зоны — удобная «площадка» для изучения качества воздуха. Они рассмотрели два распространенных типа твердых частиц: PM2.5 — более тонкая пыль диаметром 2,5 микрометра и меньше, и PM10 — несколько крупнее, до 10 микрометров. Оба типа остаются взвешенными в воздухе и считаются одними из наиболее вредных для здоровья человека загрязнителей. Команда собрала почасовые измерения этих частиц с декабря 2020 по ноябрь 2021 года, создав подробный отчет о том, как загрязнение росло и падало в течение дней, недель и сезонов.
Очистка «грязных» реальных данных
Как и в большинстве реальных систем наблюдения, приборы города не давали идеальных данных. В некоторые часы записи отсутствовали из‑за сбоев датчиков или проблем связи, а распределения содержали отдельные экстремальные всплески. Вместо простого заполнения пропусков линейными приближениями, которые могли бы сгладить реальные пики загрязнения, авторы применили метод, учитывающий сезонность. Сначала они выделили регулярные суточные закономерности — например, повышение в часы интенсивного движения — затем заполнили только оставшуюся нерегулярную часть сигнала с помощью локального сглаживания. Они также разложили повторяющиеся шаблоны на нескольких временных масштабах (день, неделя, год) и использовали технику обнаружения аномалий для пометки и корректировки подозрительных выбросов. Такая осторожная очистка была направлена на сохранение реальных событий загрязнения и удаление шума.
Когда математика и машины работают вместе
В основе исследования лежит сочетание классической математики и современной искусственной интеллекта. Авторы использовали ряды Фурье — инструмент, который разбивает сложную кривую на сумму простых волн — чтобы разложить временной ряд загрязнения на тренд, сезонные циклы и остаточные флуктуации. Затем они обучили две популярные модели машинного обучения на этих обработанных сигналах: машины опорных векторов (SVM), которые находят закономерности в данных через гибкие разделяющие поверхности, и сети с долгой краткосрочной памятью (LSTM) — тип нейронной сети, приспособленный к обучению на последовательных данных во времени. Версии каждой модели с предобработкой на основе Фурье (SVMF и LSTMF) сравнивали с моделями, обученными только на сырых данных.

Что показывают сезонные закономерности
Почасовые записи выявили отчетливые сезонные ритмы в воздухе Мохаммедии. Для PM2.5 осень показала самые высокие средние уровни, с длительными вечерними и ночными пиками примерно с 19:00 до 02:00, что, вероятно, связано с движением транспорта, торговлей и общественной активностью. Зима и лето также демонстрировали сильные вечерние и поздние ночные пики, тогда как весна проявляла две основные горки: одну в ранние часы после полудня и другую вечером. PM10 следовал в общих чертах похожим закономерностям, с выраженными вечерними пиками и более низкими дневными уровнями в большинстве сезонов. Эти схемы подчеркивают, что наихудшее качество воздуха часто совпадает с теми периодами, когда многие люди находятся на улице или в пути.
Более точные прогнозы на распадаемых сигналах
Во всех четырех сезонах и для обоих загрязнителей гибридные модели, объединявшие разложение Фурье и машинное обучение, заметно превосходили модели, обученные на сырых данных. Модель LSTMF, которая сочетает LSTM с предобработкой на основе Фурье, стабильно показывала лучшие результаты. Для почасового прогноза ее точность была наивысшей в каждом сезоне, особенно выраженно — осенью. Когда команда расширила горизонт прогнозирования до семи дней, LSTMF по‑прежнему демонстрировала высокую эффективность, с коэффициентами детерминации (R²), близкими к 0,9 или выше во многих случаях. Проще говоря, разложение сигнала помогло моделям сосредоточиться на значимой структуре — долгосрочных трендах и повторяющихся циклах — одновременно лучше справляясь с краткосрочным шумом.
Что это значит для повседневной жизни
Для неспециалистов ключевой вывод заключается в том, что более умные прогнозы позволяют превратить сырые данные датчиков в практическую защиту. Точнее предсказывая почасовые уровни PM2.5 и PM10, городские планировщики и службы здравоохранения могут заранее выявлять периоды пикового загрязнения и предупреждать людей с проблемами дыхания, регулировать потоки транспорта или вводить промышленные ограничения. Хотя исследование охватывало только один марокканский город и использовало лишь прошлые измерения частиц (без учета метеоусловий или данных об выбросах), оно показывает, что сочетание глубинного обучения с математическим разложением — мощный рецепт для более чистых и надежных прогнозов качества воздуха. При дальнейшем совершенствовании и расширении на другие места такие инструменты могли бы лечь в основу систем раннего предупреждения, которые помогут людям дышать немного легче в повседневной жизни.
Цитирование: Bennis, M., Youssfi, M., Morabet, R.E. et al. Particulate matter (PM2.5 and PM10) prediction using fourier series decomposition in combination with LSTM and SVM. Sci Rep 16, 7665 (2026). https://doi.org/10.1038/s41598-026-38436-4
Ключевые слова: прогнозирование загрязнения воздуха, твердые частицы, машинное обучение, разложение Фурье, городское качество воздуха