Clear Sky Science · ru

Интеграция регрессии-кригинга на основе случайного леса для анализа пространственной изменчивости осадков в засушливых и полузасушливых регионах

· Назад к списку

Почему важно картировать дождь в сухих регионах

В странах, где вода в дефиците, точное знание того, где и когда идут дожди, может решать судьбу продовольственной безопасности. Пакистан простирается от гор до пустынь и плодородных равнин, и под влиянием изменений климата режим осадков стал более непредсказуемым. При этом наземных метеостанций немного и они удалены друг от друга. В этом исследовании поставлен практический вопрос: можно ли при ограниченных данных с помощью современных методов машинного обучения и классических картографических подходов получить более четкие и надежные карты осадков для поддержки сельского хозяйства, планирования на случай паводков и управления водными ресурсами?

Figure 1
Figure 1.

Как из отдельных дождемеров получить полноценные карты

Исследователи использовали месячные данные осадков за два десятилетия (2001–2010 и 2011–2021) с 42 станций по всему Пакистану и единую климатическую базу данных NASA. Вместо того чтобы загружать в модель десятки экологических переменных, они сознательно ограничились только широтой и долготой. Такое упрощение позволило сосредоточиться на главном: какой математический подход лучше всего превращает разрозненные точечные измерения в непрерывную карту. Сравнивали шесть методов машинного обучения — случайный лес, метод опорных векторов, k-ближайших соседей, нейронную сеть, эластичную сеть и полиномиальную регрессию — каждый встроенный в рамки так называемой регрессии-кригинга, широко применяемой в геонауках.

Сочетание обучения по большим данным со пространственным чутьем

Регрессия-кригинг работает в два этапа. Сначала регрессионная модель прогнозирует осадки в любой точке по её координатам, улавливая широкие закономерности — например, более влажные горы и более сухие пустыни. Затем пространственный метод кригинга восполняет оставшиеся локальные систематические отклонения между наблюдениями и прогнозами. Чтобы сделать второй шаг надежным, команда предварительно изучила, насколько похожи или различны осадки между парами станций на разных расстояниях — инструмент, называемый вариограммой. Они обнаружили, что простые «круговые» и «линейные» математические формы лучше всего описывают, как сходство осадков ослабевает с расстоянием в разные сезоны и между двумя декадами, что указывает на плавные, региональные погодные системы, а не на резкие скачки.

Случайный лес оказался лидером

Установив пространственную структуру, каждая из методов машинного обучения поочередно выступала в роли регрессионного движка в гибридной модели. Авторы оценивали результаты стандартными метриками ошибки и долей объясненной дисперсии осадков. Почти по всем месяцам и в обеих декадах подход на базе случайного леса давал наиболее точные и стабильные карты. Он значительно сокращал ошибки прогноза по сравнению с полиномиальной регрессией и последовательно превосходил метод опорных векторов, нейронные сети и другие методы, особенно в муссонные месяцы, когда осадки наиболее интенсивны и изменчивы. Полученные карты были плавными там, где это нужно, но при этом фиксировали резкие контрасты между сухими и влажными зонами с относительно невысокой неопределенностью.

Figure 2
Figure 2.

Что показывают меняющиеся модели осадков

Сравнение двух декад выявило признаки изменения поведения осадков. В среднем в поздней декаде (2011–2021) было больше осадков, а также возросла изменчивость по месяцам и по территории, особенно весной и в период муссонов. Пространственная структура осадков стала более рассеянной, что свидетельствует о более широких колебаниях в распределении осадков. Важно, что сочетание случайного леса и кригинга справлялось как с более мягким климатом предыдущего периода, так и с более переменным недавним периодом, не теряя точности, что говорит о том, что такие гибкие инструменты хорошо подходят для работы в условиях потепления и возросшей непредсказуемости.

От карт к практическим решениям

Проще говоря, статья показывает, что умные алгоритмы способны извлечь больше пользы из ограниченных записей осадков, создавая детализированные карты, полезные даже в регионах с бедной сетью наблюдений. Для Пакистана такие карты могут помочь в более эффективном планировании орошения, управлении резервуарами и защитой от наводнений, а также в выявлении сообществ, наиболее уязвимых к засухам или сильным ливням. Авторы подчёркивают, что их работа представляет собой доказательство работоспособности, сосредоточенное на самих методах картирования, а не полноценную систему раннего оповещения о наводнениях или засухах. Тем не менее вывод ясен: объединение ансамблевых методов машинного обучения, возглавляемых случайным лесом, с геостатистическими картами предлагает мощный и практичный способ отслеживать изменения осадков в засушливых и полузасушливых районах по всему миру.

Цитирование: Manaf, M., Ali, Z. & Scholz, M. Integrating random forest-based regression kriging for analyzing spatial variability of rainfall in arid and semi-arid regions. Sci Rep 16, 5298 (2026). https://doi.org/10.1038/s41598-026-36074-4

Ключевые слова: картирование осадков, случайный лес, регрессия-кригинг, климат Пакистана, водные ресурсы