Clear Sky Science · ru

Глобальный набор данных OMI HCHO Level-3 с передискретизацией: высокое пространственное разрешение и упрощённая оценка неопределённости

· Назад к списку

Почему важно наблюдать невидимые загрязнители воздуха

Формальдегид в воздухе невидим, но он незаметно влияет и на наше здоровье, и на химию атмосферы. Он токсичен, может повышать риск рака и играет ключевую роль в образовании смога и дымки. До недавнего времени учёным было трудно детально отслеживать этот газ по всему миру. В этой статье описан новый высокоразрешающий долгосрочный набор данных, полученный из спутниковых наблюдений, который позволяет исследователям видеть распределение формальдегида яснее, чем когда-либо, помогая точно определять источники загрязнения и лучше понимать, как человеческая деятельность влияет на качество воздуха и климат.

Figure 1
Figure 1.

Долгие наблюдения за короткоживущим газом

Формальдегид в нижней атмосфере в основном образуется при фотолизе других газов, прежде всего летучих органических соединений, выделяемых лесами, при пожарах, с топливом и в промышленности. Поскольку формальдегид недолговечен, его концентрация даёт приближённую «снимок» текущих выбросов предшественников. Почти два десятилетия инструмент Ozone Monitoring Instrument (OMI) НАСА измеряет формальдегид из космоса, создавая уникально длительную глобальную запись. Однако исходные продукты OMI имеют крупные пиксели шириной в десятки километров и значительные неопределённости, что затрудняет выявление городских источников выбросов или уверенное отслеживание тенденций. Новый набор данных, названный OMHCHOS V1.0, разработан для устранения этих ограничений при сохранении полного временного интервала 2005–2023 годов.

Как из множества размытых снимков получить более чёткое изображение

Ключевая идея OMHCHOS — «передискретизация» (oversampling) — объединение множества перекрывающихся пролётов спутника для повышения резкости. Каждый пролёт OMI наблюдает Землю вытянутыми пикселями с наибольшей чувствительностью в центре и более слабой на краях. Вместо того чтобы считать каждый пиксель однородным блоком, авторы моделируют внутреннюю чувствительность пикселя и его перекрытие с гораздо более тонкой сеткой. Сложив данные с десятков тысяч пролётов и аккуратно взвешивая вклад каждого пикселя в каждую ячейку сетки, они получают карты с разрешением до примерно 5 километров. Одновременно они отслеживают, как погрешности измерений распространяются в этом процессе, так что каждая ячейка сетки содержит не только значение, но и количественную оценку неопределённости.

От необработанных пролётов к удобным картам

Создание этого глобального продукта потребовало обработки почти 100 000 пролётов сырых данных OMI уровня Level‑2 по формальдегиду с использованием пользовательского алгоритма на Fortran, запускаемого из R и shell‑скриптов. Команда сначала отбрасывает проблемные пиксели — с чрезмерной облачностью, экстремальными углами наблюдения или известными инструментальными проблемами — затем выполняет передискретизацию для размера сетки, выбираемого пользователем. В результате получается гибкий Level‑3 набор данных с семью пространственными разрешениями (от 0.05° до 1.0°) и двенадцатью временными разрешениями (от одного до двенадцати месяцев). Каждая комбинация даёт три сопоставленных слоя: средний столб формальдегида, его неопределённость и относительную неопределённость. Файлы снабжены как в форматах RData, так и NetCDF, а также готовыми глобальными картами, чтобы пользователи могли быстро оценить качество данных и выявить паттерны.

Проверка точности по другим «глазам» на атмосферу

Чтобы показать надёжность новых карт, авторы сравнивают OMHCHOS с несколькими независимыми источниками. По сравнению с существующим сеточным продуктом OMI от НАСА передискретизированные данные демонстрируют очень высокую корреляцию по континентам и в тщательно отобранных регионах с высокими и низкими выбросами. Различия, оцененные стандартными статистическими метриками ошибок, в целом малы и часто лучше или сопоставимы с прежними спутниковыми валидациями. Наземные телескопы (инструменты MAX‑DOAS) в пригородных и городских точках в Китае и Европе показывают, что новый набор данных точно отслеживает помесячные вариации местного формальдегида, с умеренным но устойчивым занижением, которое можно скорректировать. Сравнения с подробной моделью переноса химических веществ (GEOS‑Chem) также демонстрируют общее согласие в пространстве и времени повышенных концентраций формальдегида, особенно над регионами с биомассосжиганием и густонаселёнными территориями.

Figure 2
Figure 2.

Выбор подходящего уровня детализации

Разные научные и политические задачи требуют разных компромиссов между пространственной детализацией, временным усреднением и неопределённостью. Чтобы помочь пользователям, команда построила трёхмерную «оптимизационную» модель, связывающую размер ячейки сетки, период усреднения и типичную относительную неопределённость. Проще говоря, очень мелкие сетки и короткие периоды усреднения (например, месячные карты 0.05°) дают резкие изображения, но более высокую неопределённость, тогда как более крупные сетки и длительное усреднение значительно снижают шум. Авторы свели эту зависимость в таблицы‑подсказки, которые рекомендуют подходящие настройки — например, какие размеры сетки и временные окна выбрать, если требуется относительная неопределённость ниже 10% для глобальных исследований, или как ослабить требования к неопределённости при отслеживании мелкомасштабных горячих точек около городов или пожаров.

Более чёткие карты для чищего воздуха

Для неспециалистов главный вывод в том, что работа превращает огромный, но несовершенный поток спутниковых измерений в более резкую, надёжную атлас ключевого загрязнителя воздуха. Предоставляя покрытие на километровом масштабе, количественные оценки неопределённости и гибкие выборы пространственных и временных масштабов, набор данных OMHCHOS упрощает определение мест с наибольшими концентрациями формальдегида — а значит, и его прекурсоров — показывает, как они меняются по сезонам и годам и как реагируют на такие события, как лесные пожары, промышленный рост или локдауны. Эти более ясные карты могут поддержать лучшее управление качеством воздуха и более надёжные оценки рисков для здоровья, а также помочь учёным распутать сложную химию, связывающую человеческую деятельность, природные выбросы и воздух, которым мы дышим.

Цитирование: Xia, H., Wang, D., Yang, X. et al. Global OMI HCHO Level-3 oversampling dataset: high spatial resolution and lightweight uncertainty. Sci Data 13, 253 (2026). https://doi.org/10.1038/s41597-026-06577-w

Ключевые слова: спутниковое качество воздуха, загрязнение формальдегидом, данные дистанционного зондирования, атмосферная химия, глобальные выбросы