Clear Sky Science · ru
Многомодельное прогнозирование $$\text {NO}_{2}$$ и $$\text {O}_{3}$$ в Абу‑Даби: преимущества расширения признаков на основе корреляции
Почему важны точные прогнозы чистоты воздуха
Жители быстро растущих городов, таких как Абу‑Даби, дышат воздухом, постоянно формируемым движением транспорта, промышленностью и погодой. Два невидимых газа — диоксид азота и приземный озон — играют важную роль в образовании смога и проблемах с дыхательной системой. В этом исследовании поставлен практический вопрос с реальными последствиями: насколько точно мы можем прогнозировать эти загрязнители за часы и дни вперед с помощью современных методов искусственного интеллекта и можно ли улучшить прогнозы, обучив модели учитывать влияние этих двух газов друг на друга?

Два «вредителя» городского воздуха
Диоксид азота и озон тесно связаны в атмосфере. Диоксид азота в основном поступает от выхлопов автомобилей и других источников сгорания; при солнечном свете он способствует образованию озона, который является важным компонентом смога. Днем уровни озона растут, в то время как диоксид азота часто снижается, а ночью эта картина может меняться на противоположную. В Абу‑Даби быстрый рост городов, интенсивное движение и пустынные условия, ограничивающие естественную «очистку» воздуха, делают эти загрязнители особой проблемой. Точное предвидение их колебаний позволяет властям предупреждать уязвимые группы населения, корректировать потоки транспорта или планировать промышленную деятельность, чтобы снизить риски для здоровья.
Обширный взгляд на воздух Абу‑Даби
Исследователи использовали необычно большой и подробный набор данных: пятигодовой почасовой ряд измерений диоксида азота и озона с семи стационарных постов, расположенных в пустынных районах, пригородах, прибрежных округах и промышленной зоне эмирата Абу‑Даби. Этот длительный период, охватывающий 2018–2022 годы, избегает искажений, связанных с локдаунами в период COVID‑19, которые влияли на ранние исследования. Команда тщательно очистила данные, заполняя отдельные пробелы усреднением значений с аналогичных дат и часов в другие годы, и применила математические приемы для обработки резких всплесков при сохранении реальных экстремумов загрязнения. Затем временной ряд разделили на последовательные обучающие и тестовые блоки, имитируя, как реальная система прогнозирования училась бы на прошлом и оценивалась по будущим, неизвестным периодам.
Сравнение множества методов прогнозирования
Чтобы выяснить, какие инструменты работают лучше, в исследовании сравнили широкий набор подходов. К более простым методам относились деревья решений, случайный лес и метод опорных векторов, которые ищут закономерности в прошлых измерениях. К более продвинутым методам глубокого обучения относились сверточные нейронные сети, хорошо распознающие локальные формы во временных рядах, и сети LSTM, предназначенные для запоминания долговременных зависимостей. Исследователи также использовали Prophet — модель, заточенную под повторяющиеся суточные и сезонные циклы, — и модель Transformer, более новую архитектуру с «механизмом внимания», который взвешивает влияние различных прошлых моментов при построении прогноза. Всем моделям предлагалось прогнозировать уровни загрязнителей на 1 час, 2 часа, 1 день и 1 неделю вперед, а их ошибки оценивались по нескольким взаимодополняющим метрикам.
Извлекая уроки из совместного поведения загрязнителей
Поскольку диоксид азота и озон химически взаимосвязаны, команда изучила, может ли история одного загрязнителя помочь в прогнозировании другого. Сначала они измерили степень связи между двумя газами на каждом посту и подтвердили в целом сильную обратную зависимость: когда один был высок, другой, как правило, был низким. Затем для каждой модели построили две версии. В базовой версии модель видела только прошлые значения того загрязнителя, который нужно было предсказать. В расширенной версии ей также давали лаговые значения другого газа, фактически предоставляя подсказку о текущем состоянии городского воздуха. Это позволило исследователям проверить, снижает ли «расширение признаков» — добавление скоррелированной информации — погрешности прогнозов, не вводя сведений из будущего.

Какие модели победили и почему это важно
Во всех, или почти во всех, постах, по всем загрязнителям и на всех горизонтах прогнозирования модель Transformer явно превзошла остальные, обеспечив наименьшие средние ошибки и самую стабильную работу во времени. Для диоксида азота типичная относительная ошибка составляла примерно от одной четверти до одной трети, а для озона она оказалась несколько ниже. Сверточные сети шли на расстоянии, особенно в очень краткосрочных прогнозах в первые пару часов, тогда как Prophet оказался полезным на недельном горизонте благодаря хорошему учету повторяющихся паттернов. Важно, что предоставление моделям дополнительной информации о сопряженном газе последовательно снижало ошибки прогнозов, особенно для часового прогноза диоксида азота и для прогнозов озона до одних суток вперед. Проще говоря, это исследование показывает, что современные модели на основе механизма внимания, обученные на богатой многолетней записи и использующие «диалог» между ключевыми загрязнителями, способны давать более надежные прогнозы качества воздуха. Такие инструменты могут помочь городским планировщикам и здравоохранительным службам Абу‑Даби и похожих регионов действовать раньше и точнее для защиты общественного здоровья, особенно детей, пожилых людей и людей с заболеваниями легких или сердца.
Цитирование: Abuouelezz, W., Ali, N., Aung, Z. et al. Multi-model forecasting of \(\text {NO}_{2}\) and \(\text {O}_{3}\) in Abu Dhabi: benefits of correlation-based feature augmentation. Sci Rep 16, 13825 (2026). https://doi.org/10.1038/s41598-026-44485-6
Ключевые слова: прогнозирование загрязнения воздуха, диоксид азота, озон у поверхности, модели глубокого обучения, качество воздуха в Абу‑Даби