Clear Sky Science · ru

Прогнозирование температурных трендов с использованием объяснимого искусственного интеллекта и машинного обучения на основе ОВП: пример Зонгулдака, Турция

· Назад к списку

Почему важны локальные температурные тренды

Для многих сообществ изменение климата кажется далёкой глобальной проблемой. Но его последствия проявляются наиболее явно в локальной погоде: более жаркие лета, сдвиги в распределении осадков и более интенсивные штурмы. В этом исследовании рассматривается Зонгулдак, прибрежная и промышленная провинция на Западном Черном море Турции, и ставится практический вопрос: могут ли современные методы искусственного интеллекта не только точно прогнозировать локальные температурные тренды, но и объяснить, как они приходят к таким прогнозам, чтобы планировщики и жители могли доверять и использовать эти результаты?

Преобразование сырых метеоданных в полезные подсказки

Чтобы ответить на этот вопрос, исследователи собрали более двух десятилетий ежемесячных метеорологических записей для Зонгулдака за 2000–2022 годы. Набор данных включал среднюю, минимальную и максимальную температуру воздуха, несколько показателей осадков, направление и скорость ветра, а также влажность. Прежде чем какая-либо модель могла обучаться на этих данных, команда провела их очистку и стандартизацию: пропущенные значения были заполнены, текстовые метки вроде направлений ветра преобразованы в числа, а все переменные приведены к единой шкале, чтобы ни одна измеряемая величина не доминировала только из‑за своих единиц измерения.

Сведение сложных погодных закономерностей к смысловым факторам

Климатические данные как правило запутаны: многие переменные меняются совместно, и между некоторыми из них сильная связь. Чтобы упростить эту сеть без потери важной информации, исследователи использовали метод анализа главных компонент (ОВП). Вместо того чтобы рассматривать каждое исходное измерение отдельно, ОВП создаёт небольшое число новых «суммарных» факторов, которые захватывают большую часть изменчивости данных. В этом исследовании команда сохранила достаточно факторов, чтобы сохранить 95 процентов исходной информации. Наиболее важный фактор, известный как первая главная компонента, оказался значимым сочетанием температуры и ветра: более высокие минимальные и максимальные температуры повышали значение этого фактора, в то время как более сильный ветер снижал его.

Figure 1
Figure 1.

Выбор наиболее надёжных прогнозных алгоритмов

Имея эти упрощённые климатические факторы, команда протестировала набор методов машинного обучения для прогнозирования среднемесячной температуры. Некоторые были простыми моделями с линейной зависимостью; другие, такие как нейронные сети и бустинговые деревья, способны улавливать более сложные взаимосвязи. Исследователи разделили данные на тренировочную и тестовую выборки и оценивали каждую методику по нескольким метрикам ошибки и качества подгонки. Несмотря на ажиотаж вокруг сложных «чёрных ящиков», очевидными лидерами оказались два простых линейных подхода — линейная регрессия и гребневая регрессия (ridge). Эти модели постоянно давали наименьшие ошибки и объясняли более 90 процентов изменчивости в тестовых данных, показывая, что для этого региона и временного масштаба температура ведёт себя в значительной степени линейно и предсказуемо.

Открывая «чёрный ящик» решений ИИ

Самой точности недостаточно, если прогнозы будут использоваться при планировании инфраструктуры, сельского хозяйства или здравоохранения. Чтобы понять, почему модели дают те или иные предсказания, команда обратилась к инструментам объяснимого ИИ. Они обучили модель на основе деревьев, хорошо подходящую для такого анализа, и использовали два дополняющих друг друга метода: «пермутационную значимость», которая измеряет, насколько ухудшаются предсказания при перемешивании одного фактора, и значения SHAP, которые назначают каждому фактору вклад в конкретное предсказание. Оба подхода указали на одну и ту же картину: первая главная компонента доминирует в решениях модели, тогда как несколько других компонент играют второстепенные роли. Анализ структуры этой ведущей компоненты показал, что более тёплые условия (более высокие минимальные и максимальные температуры) сильно повышают предсказанную среднюю температуру, тогда как более быстрый ветер, наоборот, её понижает. Влажность и осадки сыграли более умеренную роль.

Figure 2
Figure 2.

Что это значит для людей и планировщиков

Проще говоря, исследование демонстрирует, что возможно создать инструменты прогнозирования температуры, которые одновременно точны и понятны. Для Зонгулдака простые, хорошо проверенные статистические модели, управляемые аккуратно сведёнными климатическими факторами, показали себя не хуже и даже лучше более сложных систем ИИ. Анализы объяснимости подтвердили, что поведение моделей физически осмысленно: они сильно реагируют на изменение температуры и скомпенсированно — на ветер. Такое сочетание производительности и прозрачности делает предложенную схему многообещающей для других регионов, стремящихся отслеживать локальные климатические тренды и разрабатывать стратегии адаптации на основе надёжных и интерпретируемых данных.

Цитирование: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6

Ключевые слова: прогнозирование температуры, изменение климата, машинное обучение, объяснимый ИИ, анализ главных компонент