Clear Sky Science · ru

Подход на основе спутниковых данных и машинного обучения для оценки высокоразрешённой среднесуточной температуры воздуха в мегаполисе Бразилии

· Назад к списку

Почему температура в городе различается от места к месту

В жаркий день в большом городе температура, которую вы ощущаете на улице с деревьями, может сильно отличаться от той, что испытывает человек на бетонной площади в нескольких кварталах. Тем не менее большинство исследований в области здоровья и климата по‑прежнему рассматривают весь город как единое целое с одной температурой. В этой работе показано, как учёные использовали спутники, погодные модели и машинное обучение, чтобы картировать ежедневные температуры по всему Сан‑Паулу (Бразилия) с высокой детализацией — помогая выявить, кто на самом деле подвергается опасной жаре и где наиболее необходимы меры по охлаждению.

Figure 1
Figure 1.

Измерение температуры города в высоком разрешении

Традиционные записи температуры опираются на ограниченное число метеостанций, часто сосредоточенных у аэропортов или в более обеспеченных районах. Это затрудняет понимание распределения тепла по реальным кварталам, особенно в крупных городах и в странах с низким и средним доходом, где сети наблюдений разрежены. Исследователи сосредоточились на Сан‑Паулу — обширном и сильно разнородном мегаполисе с населением более 22 миллионов человек. Их цель состояла в оценке среднесуточной температуры воздуха для каждой клетки размером 500×500 метров по всей столичной зоне в течение пяти лет — с 2015 по 2019 годы — создав один из самых детализированных наборов данных о городских температурах, доступных в Южной Америке.

Сочетание спутников, погодных моделей и наземных датчиков

Чтобы построить эту высокоразрешённую картину, команда объединила несколько типов общедоступных данных. Они собрали измерения с 48 наземных станций, которые дают наиболее прямые показания температуры воздуха, но только в отдельных точках. Затем они привлекли спутниковые наблюдения температуры поверхности земли, угла падения солнечного света и отражательной способности поверхности, а также информацию о влажности, ветре и давлении из глобального погодного «реанализа», который восстанавливает почасовую погоду на грубой сетке. Эти данные были пересемплированы под сетку 500 метров и очищены для заполнения пропусков, вызванных облачностью или отсутствием спутниковых снимков. В сумме они протестировали 23 возможных предиктора, которые могли бы помочь объяснить пространственные и временные вариации тепла.

Обучение машины распознавать тепло

Вместо простой линейной формулы учёные использовали Random Forest — популярный метод машинного обучения, который строит множество деревьев решений и усредняет их прогнозы. Этот подход хорошо подходит для выявления сложных, нелинейных зависимостей, например того, как температура по‑разному реагирует на нагрев поверхности, влажность и ветер в разных частях города или в разное время года. Чтобы избежать переобучения на особенностях отдельных станций, они применили пошаговый отбор признаков, оставляя только переменные, которые действительно улучшают прогноз, и валидацию модели провели двумя способами: многократным исключением групп станций при обучении и строгой внешней проверкой — удержанием пяти станций целиком для тестирования работы модели в новых местах.

Что показывают подробные карты

Конечная модель использовала всего восемь ключевых переменных, лидером среди которых была температура воздуха из глобального погодного продукта; важную роль также сыграли спутниковая температура поверхности и влажность. Модель очень близко воспроизводила показания станций: средняя ошибка составляла около 0,8 °C, а согласованность между наблюдаемыми и предсказанными температурами была очень высокой. Карты выявляют отчётливые закономерности: более прохладные зоны — над лесами, возвышенностями и большими водохранилищами, и более тёплые — в плотной застройке в центре города, где температура может быть на 5 °C выше, чем в близлежащих сельских районах. Модель захватила сезонные колебания — самые тёплые условия с декабря по март и самые прохладные с мая по август. В сельских районах точность была несколько ниже, и модель склонна сглаживать самые экстремальные жаркие и холодные дни, но всё равно превосходила более традиционную многолинейную регрессию с теми же входными данными.

Figure 2
Figure 2.

Почему эти карты важны для общественного здоровья

Преобразуя разрозненные измерения и спутниковые снимки в ежедневные оценки температуры на уровне улиц, эта работа предлагает мощный новый инструмент для общественного здравоохранения и градостроительного планирования в Сан‑Паулу и за его пределами. Исследователи теперь могут изучать, как жара влияет на разные кварталы, включая неформальные поселения, которые часто отсутствуют в официальных данных, и определять, где жители находятся в наибольшей зоне риска во время волн тепла. Поскольку метод опирается полностью на открытые данные и стандартное программное обеспечение, его можно адаптировать к другим городам, где есть несколько наземных станций и аналогичное спутниковое покрытие. Проще говоря, исследование показывает, что мы теперь можем «видеть» городское тепло с гораздо большей детализацией, обеспечивая необходимую основу для более справедливой и целенаправленной адаптации к климату и защиты уязвимых сообществ.

Цитирование: Roca-Barceló, A., Schneider, R., Pirani, M. et al. A satellite based machine learning approach for estimating high resolution daily average air temperature in a megacity in Brazil. Sci Rep 16, 7459 (2026). https://doi.org/10.1038/s41598-026-35689-x

Ключевые слова: городское тепло, машинное обучение, спутниковые данные, Сан-Паулу, температура воздуха