Clear Sky Science · ru
Спектральная проверка эффекта бабочки и физической согласованности в ансамблях GenCast на основе диффузии
Почему мелкие ошибки в погоде важны
Прогнозы погоды дают сбои не только потому, что нам не хватает данных; они также терпят неудачи потому, что небольшие погрешности в сегодняшней атмосфере могут со временем усиливаться — идея, часто называемая эффектом бабочки. По мере того как мощные модели искусственного интеллекта начинают соперничать с традиционными физическими моделями погоды, важно спрашивать не только то, хорошо ли эти системы показывают себя по общим метрикам точности, но и ведут ли они себя как реальная атмосфера, когда крошечные ошибки растут и распространяются.

Старые и новые инструменты прогнозирования
Современные метеослужбы опираются на физически обоснованные компьютерные модели, которые моделируют ветры, облака и температуру по всему земному шару. Эти модели, например система Европейского центра, запускают одновременно множество слегка отличающихся реализаций, чтобы показать, как неопределённость растёт со временем. В последнее время появились модели предсказания погоды на основе глубокого обучения, такие как GenCast. Вместо пошагового решения физических уравнений GenCast обучается на десятилетиях реанализа и добавляет тщательно структурированный шум, чтобы очень быстро создавать большие ансамбли прогнозов. В этом исследовании рассматривается, ведут ли себя такие ансамбли, созданные ИИ, как ансамбли традиционных моделей в части распространения ошибок по разным пространственным шкалам.
Отслеживание энергии по большим и мелким шкалам
Авторы сосредотачиваются на кинетической энергии ветров в верхних слоях атмосферы рядом со струйными течениями, где мелкие возмущения могут быстро усиливаться. Они изучают, как различия между членами ансамбля эволюционируют со временем и как энергия распределена по шкалам — от планетарных волн протяжённостью тысячи километров до мезомасштабных структур шириной в несколько сотен километров. В традиционной ансамблевой модели мелкомасштабные ошибки либо растут и затем подпитывают более крупные структуры, либо гасятся физическими процессами, такими как турбулентность и конвекция. Такое поведение оставляет характерную кривую при отображении энергии в зависимости от масштаба с предсказуемыми уклонами в разных диапазонах размеров.
Что модель ИИ делает правильно и что ей не удаётся
GenCast воспроизводит некоторые аспекты этого поведения. На средних масштабах, связанных с типичными погодными системами, рост ошибок выглядит похожим на традиционный ансамбль, а крупномасштабные потоки напоминают эталонные модели и реанализ. Однако проявляются два существенных недостатка. Во-первых, на самых больших масштабах GenCast не показывает сильного роста ошибок, наблюдаемого в физической ансамблевой модели, что говорит о неполном представлении эффекта бабочки. Во-вторых, на меньших мезомасштабных диапазонах кривая энергии выравнивается в почти постоянный хвост уже с первого шага прогноза и едва меняется со временем. При разложении ветра на компоненты и рассмотрении карт эти мелкие структуры выглядят широкими, шумными и почти как случайный зернистый фон вместо чётких нитей, выровненных по струйным течениям или сформированных горными барьерами.

Подсказки на картах резкости и рельефа
Разделяя большие и малые шкалы и исследуя их взаимодействие, авторы обнаружили, что физические модели демонстрируют заметные сигнатуры топографии, например чередующиеся структуры над Андами, указывающие на горные волны и торможение потока. У GenCast таких явных сигналов нет; вместо этого он показывает очень широкую, интенсивную мелкомасштабную энергию, которая значительно варьирует от одного члена ансамбля к другому. При изучении того, как быстро кинетическая энергия меняется в пространстве, традиционные модели показывают тонкие, извилистые линии, которые в точности повторяют ядра струй, в то время как GenCast формирует толстые, изотропные пояски шумных градиентов, которые едва эволюционируют за десять дней. Это указывает на то, что ввод шума в модели ИИ создаёт дисперсию, которая статистически выглядит энергичной, но не следует траекториям реальной атмосферной динамики.
Почему это важно для будущих моделей погоды на базе ИИ
Авторы приходят к выводу, что GenCast способен выдавать квалифицированные прогнозы и реалистичные крупномасштабные структуры, но проваливает важные тесты физической согласованности на меньших масштабах. Его обращение с шумом порождает устойчивые нефизические особенности, которые не диффундируют и не каскадируют энергию так, как в истинных атмосферных потоках, и ослабляют реалистичное распространение неопределённости на планетарных масштабах. Чтобы модели прогноза погоды на основе ИИ стали полностью надёжным партнёром традиционных моделей, их разработчикам придётся переосмыслить способы добавления и контроля случайных возмущений, чтобы ансамбли не только соответствовали метрикам, но и уважали физику эффекта бабочки.
Цитирование: Kim, H., Ryu, J., Son, SW. et al. A spectral test of the butterfly effect and physical consistency in the diffusion-based GenCast’s ensembles. npj Clim Atmos Sci 9, 110 (2026). https://doi.org/10.1038/s41612-026-01380-1
Ключевые слова: прогнозирование погоды с помощью ИИ, ансамблевое прогнозирование, эффект бабочки, спектры кинетической энергии, модель GenCast