Clear Sky Science · ru
Сравнительный анализ моделей машинного обучения с интерпретацией SHAP причин блокировок шоссе из‑за наводнений
Почему затопленные шоссе важны для повседневной жизни
Когда сильный дождь размывает дорогу или вызывает оползень, это может оставить людей в затруднительном положении, задержать экстренные службы и нарушить поставки продовольствия и товаров. В провинции Сычуань в Китае такие блокировки шоссе из‑за наводнений стали все чаще происходить по мере усиления экстремальной погоды и расширения дорожной сети. В этом исследовании поставлен практический вопрос, имеющий глобальное значение: может ли современный искусственный интеллект предсказывать, когда и где шоссе с большой вероятностью будут перерезаны наводнением, и может ли он объяснить, почему это происходит?
Картирование уязвимого горного региона
Сычуань, большая провинция на юго‑западе Китая, была выбрана в качестве полигона, поскольку сочетает разветвленную дорожную сеть с крутым рельефом и интенсивными сезонными дождями. Исследователи собрали богатый набор данных за 2021–2022 годы, включая почти 9000 ежедневных записей о блокировках шоссе из‑за наводнений, высотные и крутизну склонов по спутниковым данным, растительный покров, землепользование, реки и ручьи, осадки и температуру, а также плотность населения и дорог. Они сосредоточились на магистральных дорогах — шоссе, национальных и провинциальных трассах — где закрытия наносят наибольший социальный и экономический ущерб. Чтобы данные оставались реалистичными, они столкнулись с привычной проблемой: дней без блокировок было значительно больше, чем дней с фактическими разрывами движения.

Обучение машин предсказывать опасность
Команда построила интегрированную структуру, связывающую три идеи: более умная обработка редких событий, тщательное сравнение методов прогнозирования и прозрачные объяснения факторов риска. Поскольку события блокировки относительно редки, традиционные модели склонны «учиться» главным образом на многих безопасных днях и не замечать опасных редких случаев. Чтобы компенсировать этот дисбаланс, исследователи сравнили три стратегии. Одна просто удаляла часть дней без блокировок (недовыборка). Вторая использовала метод TimeGAN, который усваивает закономерности реальных временных рядов и затем генерирует реалистичные синтетические примеры редких дней с блокировками, чтобы усилить представление миноритарного класса. Третий гибридный подход сочетал оба подхода. На основе этих предварительно обработанных наборов данных они обучили шесть различных моделей машинного обучения — от знакомых методов, таких как логистическая регрессия и опорные векторные машины, до более гибких подходов, таких как случайный лес, градиентный бустинг и многослойный персептрон (тип нейронной сети). Оценивали производительность в основном по тому, насколько каждая модель балансировала между выявлением истинных событий блокировки и избеганием ложных тревог.
Поиск лучшего предиктора и проверка его надежности
Из множества комбинаций моделей и данных выделилась одна пара: многослойный персептрон, обученный на данных, дополненных TimeGAN. Эта конфигурация показала наивысший F1‑балл (примерно 50%) и конкурентные показатели precision–recall, то есть лучше всего обнаруживала дни с блокировками, не будучи заваленной ложными срабатываниями. Важно, что показатели модели на невидимых тестовых данных были близки к значениям во время обучения, а специальный бутстрэп‑тест, перемешивающий временные блоки, показал, что её работа стабильна, а не случайна. Иначе говоря, создание реалистичных дополнительных примеров редких событий блокировки помогло нейросети выучить полезные закономерности без переобучения на шум.

Что модель показывает о рискованных условиях
Чтобы выйти за пределы «черного ящика» предсказаний, авторы использовали метод SHAP для изучения обученной нейросети и выяснения, какие факторы имеют наибольшее значение и как именно. Анализ выделил небольшой набор порогов по погоде и местоположению, которые резко повышают риск блокировки. Суточный уровень осадков выше примерно 2,8 миллиметра и накопление эффективных осадков за семь дней выше примерно 22 миллиметров являются переломными точками: ниже этих значений условия, как правило, подавляют блокировки; выше — вероятность быстро растет по мере насыщения почв и усиления стока, размывающего склоны и дорожные насыпи. Температура играет схожую роль. При среднемесячной суточной температуре ниже примерно 21 °C риск обычно низок, тогда как более теплые условия часто совпадают с более сильными и интенсивными дождями и более влажным грунтом, что способствует большему числу оползней и размывов. Менее очевидный фактор — расстояние дороги до ближайшего потока. Когда среднее расстояние дорога–река в полосе в один километр превышает примерно 0,15 километра, риск растет, вероятно потому, что такие дороги чаще проходят по более крутым, склонным к разрушению склонам, а не по более мягким долинным полям.
Превращение знаний в более безопасные дороги
Для неспециалистов основная мысль проста: определенные сочетания «слишком много воды, слишком долго, в неподходящем ландшафте» значительно повышают вероятность блокировки шоссе. Выявив пороги по осадкам, температуре и расстоянию до реки, а также показав, что тщательно настроенная нейросеть может с приемлемой точностью предвосхищать рискованные дни, исследование предлагает практические рекомендации для дорожных служб. Эти выводы можно использовать в системах раннего предупреждения, при выборе участков для укрепления склонов или дренажа и для приоритизации сегментов длинных магистралей для мониторинга и обслуживания. По мере учащения экстремальной погоды такие ориентированные на данные и объяснимые инструменты могут сыграть ключевую роль в поддержании работы критически важных транспортных маршрутов и связности сообществ.
Цитирование: Li, B., Wu, L., Gao, J. et al. Comparative analysis of machine learning models with SHAP interpretation for causes of highway flood-damage blocking. Sci Rep 16, 5118 (2026). https://doi.org/10.1038/s41598-026-35074-8
Ключевые слова: риски наводнений на шоссе, машинное обучение, экстремальные осадки, устойчивость инфраструктуры, оползни