Clear Sky Science · ru
Транскрибирование исторических метеорологических данных Канады
Почему старые сводки погоды важны и сегодня
Когда мы думаем об изменении климата, обычно представляем спутники, суперкомпьютеры и современные метеостанции. Но чтобы понять, как климат действительно менялся на протяжении веков, учёным нужно заглянуть гораздо дальше в прошлое — в мир чернил, бумаги и аккуратных ежедневных записей. В этом исследовании описывается, как почти два миллиона рукописных наблюдений за погодой со всей территории современной Канады, сделанных в период с 1768 по 1884 годы, были тщательно оцифрованы в формат, пригодный для обработки компьютерами и использования климатическими моделями.
Скрытая погода в старых бумажных записях
Задолго до появления национальных метеослужб военные офицеры, врачи, учителя и другие добровольцы по всей Британской Северной Америке вели аккуратные ежедневные записи погоды. Их тетради и бланки в конце концов оказались в архивах США и Великобритании, а не в Канаде. Проект NORTHERN (Nineteenth-century Overseas Records Transcribed for Historical Environmental Reconstruction in the North) поставил задачу найти и спасти эти разбросанные записи. Работая преимущественно с микрофильмами из архивов США и Великобритании, команда выявила 46 мест — от атлантических портов до отдалённых торговых постов на северо-западе — где наблюдатели фиксировали от трёх до двадцати переменных погоды, часто несколько раз в сутки. Эти записи отражают не только температуру и давление, но и штормы, наводнения, ледоход, пожары и другие события, влияющие на повседневную жизнь.

Как рукописи превращались в данные
Спасение этой информации означало больше, чем просто сканирование старых страниц. Команда создала специализированную веб-систему для транскрибирования, где оцифрованные изображения метеорологических журналов отображались, а числа вводились напрямую в структурированную базу данных. Были каталогизированы разные типы бланков и макетов страниц, чтобы экраны ввода в цифровой форме имитировали оригинальные таблицы. Добровольцы выбирали типы облачности и направления ветра из контролируемых списков, чтобы сократить ошибки набора, тогда как свободные текстовые поля использовались для чисел, таких как температура и давление. Каждому файлу изображения присваивалось тщательно продуманное имя, связывающее его со станцией, датой, наблюдателем и архивом, так что любое цифровое значение всегда можно проследить до конкретной строки на конкретной странице.
Очистка и проверка чисел
Поскольку эти наблюдения проводились с использованием старых приборов и разнообразных практик, исходные числа нельзя было просто скопировать и использовать. Исследователи прогнали транскрибированные данные через несколько уровней контроля качества. Сначала специалисты визуально сравнивали таблицы базы данных с изображениями страниц, чтобы обнаружить очевидные ошибки, такие как пропущенные дни или сдвинутые десятичные точки. Затем компьютерные программы сканировали данные в поисках невозможных или подозрительных значений — температур далеко за пределами разумного диапазона или сил ветра за пределами шкалы, которой должен был пользоваться наблюдатель. Там, где наблюдатели писали дроби, сокращения или опускали ведущие нули, программное обеспечение преобразовывало или корректировало их, фиксируя каждое изменение в журнале. Команда также сравнивала между собой связанные измерения; например, минимальные температуры должны быть ниже максимальных, а скорректированное атмосферное давление обычно должно превышать сырое показание станции. Значения, которые всё ещё выглядели странно, помечались, но не удалялись, сохраняя честность записи.

Соединяя старые единицы с современными стандартами
Ещё одной важной задачей было то, что наблюдатели XIX века не оперировали современными единицами измерения. Они записывали давление в дюймах ртутного столба, температуру в градусах Фаренгейта, облачность в десятичных долях неба и ветер в смеси описательных шкал, скоростей и даже фунтов силы на пластине. Чтобы сделать эти записи сопоставимыми с современными метеоданными, команда перевела их в международные стандарты, такие как градусы Цельсия, гектопаскали и метры в секунду, опираясь на исторические инструкции и современные библиотеки преобразований. Некоторые детали, например точная сила «свежего бриза» по старой шкале ветра или формулировки примечаний о погоде, нельзя перевести идеально, поэтому их сохраняют в виде аккуратно кодированных приближений, а не принуждают к искусственным категориям.
Новое окно в столетия канадской погоды
Итогом этой работы стал общедоступный набор данных, размещённый в Национальных центрах экологической информации США. Он включает посуточные и субсуточные записи температуры, давления, ветра, облачности, влажности, осадков и описательных заметок о погоде с 1768 по 1884 годы по большой части современной Канады. Эти данные помогут учёным изучать давние жары, холодные волны, шторма и другие экстремальные явления, а также войдут в глобальные проекты «реанализа», которые реконструируют прошлые погодные поля с помощью современных физико-ориентированных моделей. Для неспециалистов проект демонстрирует, как хрупкие, забытые тетради могут превратиться в мощный инструмент для понимания того, как наш климат варьировался в течение трёх столетий, и как сегодняшние изменения соотносятся с полной картиной истории погоды Канады.
Цитирование: Slonosky, V., Black, R., Podolsky, L. et al. Transcribing historical Canadian weather data. Sci Data 13, 678 (2026). https://doi.org/10.1038/s41597-025-06036-y
Ключевые слова: исторические метеоданные, климат Канады, спасение данных, климатические экстремумы, архивы погоды