Clear Sky Science · ru

Набор данных для обнаружения и краткосрочного прогноза инициирования конвекции машинными моделями над юго-востоком Китая

· Назад к списку

Почему важно, где и когда рождается шторм

Внезапные ливни, разрушительный град и свирепые ураганные порывы ветра могут нарушить повседневную жизнь за считанные минуты. Ключ к более ранним и точным предупреждениям — заметить самую первую искру шторма — тот момент, когда небольшой карман тёплого влажного воздуха начинает превращаться в растущую грозовую облачность. В этом исследовании представлен новый, тщательно подобранный набор данных, призванный помочь искусственному интеллекту (ИИ) научиться распознавать и предсказывать эту искру, известную как инициирование конвекции, над юго-востоком Китая.

Figure 1
Figure 1.

Наблюдение за штормами с неба и с земли

Авторы сосредоточились на регионе юго-восточного Китая, сильно подверженном влиянию восточноазиатского муссона, где интенсивные грозы часто происходят с марта по сентябрь. Для подробного мониторинга атмосферы они объединяют данные из двух основных систем наблюдения. На земле более 150 метеорологических радаров сканируют небо, измеряя силу и структуру дождя и града. Одновременно геостационарный спутник Фэнъюнь-4А ведёт наблюдение из космоса, регистрируя отражение и излучение облаков в нескольких длинах волн. Вместе эти инструменты дают покадровое представление о рождении и развитии шторма каждые 10 минут на территории, простирающейся на тысячи километров.

Создание библиотеки опасной погоды

Чтобы обучать ИИ, сначала нужны примеры. Команда начала с выявления многочисленных реальных эпизодов опасной погоды — периодов с интенсивным дождём, разрушительными ветрами или градом — зафиксированных более чем в 1 000 наземных пунктов наблюдения в период с 2018 по 2023 год. Они сгруппировали перекрывающиеся события в более широкие региональные вспышки, а затем разрезали каждую вспышку на 10-минутные снимки. Для каждого снимка сохранялся богатый набор «признаковых» данных: радарные карты, показывающие где и с какой интенсивностью идёт осадок, а также спутниковые измерения, указывающие на высоту, температуру и структуру облаков. В результате получились 829 региональных событий и 136 728 временных срезов, сформировав большие и разнообразные коллекции ситуаций, когда штормы либо возникали, либо не возникали.

Обучение машин определять место рождения шторма

Определить точный момент и место появления шторма непросто. Исследователи использовали радарные мозаики — объединённые изображения от множества радаров — чтобы находить небольшие участки, где эхо впервые превышает определённый порог, сигнализируя о рождении новой конвективной ячейки. Затем они оценивали движение каждой ячейки с помощью метода оптического потока, который отслеживает закономерности на радарных изображениях во времени. Сравнивая положения эха в предыдущих и последующих 10-минутных снимках, алгоритм может решить, действительно ли ячейка только что образовалась (истинная инициирование), либо является продолжением, подвижной частью более старого шторма, либо ложным эхо, вызванным помехами радара. Подозрительные случаи дополнительно проверялись вручную, чтобы удалить остаточные технические артефакты.

Маркировка ячеек: развиваются или затухают

После выявления конвективных ячеек следующим шагом была классификация их дальнейшего поведения. Для каждой новорождённой ячейки команда отслеживала изменения в течение следующих 30 минут, измеряя, как изменялись её площадь и радарная интенсивность. Если ячейка последовательно увеличивалась в размерах и усиливалась, её маркировали как «развивающуюся» инициирование, то есть имеющую потенциал стать серьёзным штормом. Если она ослабевала, исчезала или не показывала роста, её помечали как «затухающую». В сумме в наборе данных содержится более четырёх миллионов ячеек инициирования, из которых около 43 процентов являются развивающимися. Эти метки могут быть представлены простыми контурами и пиксельными масками на радарной сетке, что делает их удобной целью для моделей машинного обучения, стремящихся предсказать не только место возникновения шторма, но и то, станет ли он опасным.

Figure 2
Figure 2.

Где и когда штормы чаще всего зарождаются

Подсчитывая, как часто инициирование происходит в разных местах и в разное время суток, набор данных также выявляет закономерности в поведении гроз. Районы с частыми случаями инициирования хорошо коррелируют с регионами обильных осадков, особенно вдоль прибрежных провинций и к югу от реки Янцзы, где тёплый влажный воздух поддерживает частые грозы. Временная активность инициирования демонстрирует чёткие суточные ритмы: в многих районах новые штормы чаще всего появляются после полудня, тогда как в некоторых глубоких внутренних бассейнах наблюдаются пики около полуночи с вторичными максимумами днём. Эти закономерности согласуются с предыдущими исследованиями более крупных штормовых систем, что говорит о том, что новый алгоритм захватывает реалистичное поведение рождения штормов, а не случайный шум.

Что это значит для будущих предупреждений о погоде

Главное сообщение для неспециалистов простое: эта работа предоставляет высококачественную тренировочную базу для ИИ-систем, которые стремятся заметить самые ранние признаки сильных гроз. Объединив плотные радарные сети, продвинутую спутниковую съёмку и тщательную классификацию рождения и роста штормов, набор данных CIDS даёт моделям машинного обучения и исходные изображения, и правильные ответы, необходимые для обучения. В долгосрочной перспективе более умные модели, построенные на этом наборе, могут привести к более ранним и надёжным предупреждениям о внезапных наводнениях, разрушительных ветрах и граде, давая сообществам ценное время на подготовку.

Цитирование: Liu, Y., Xiong, A., Liu, N. et al. A dataset for machine learning model to convective initiation detection and nowcasting over southeastern China. Sci Data 13, 557 (2026). https://doi.org/10.1038/s41597-026-06902-3

Ключевые слова: прогноз гроз, метеорологический радар, спутниковая метеорология, машинное обучение, сильная конвекция