Clear Sky Science · zh
转录加拿大历史气象数据
为何旧气象记录至今仍然重要
谈到气候变化,我们通常会想到卫星、超级计算机和现代气象站。但要真正了解几个世纪以来气候如何演变,科学家必须回溯更久远的过去——那是一个以墨水、纸张和每日细致记录为主的世界。本研究描述了如何将1768年至1884年间在今加拿大境内记录的近两百万条手写气象观测,经过细致整理,转化为计算机可读并可供气候模型使用的数字数据。
隐藏在旧纸张中的天气
在国家气象机构出现很久以前,英属北美各地的军官、医生、教师及其他志愿者都会认真记录每日天气。他们的笔记本和预印表格最终被存放在美国与英国的档案馆,而非加拿大本土。NORTHERN项目(Nineteenth-century Overseas Records Transcribed for Historical Environmental Reconstruction in the North)着手寻找并抢救这些分散的记录。主要依靠来自美、英档案馆的缩微胶片,团队确定了46个观测地点——从大西洋港口到西北偏远的贸易站——这些地点的观测者记录了三到二十种气象变量,且常在一天内多次记录。这些记录不仅涵盖温度和气压,还记载了风暴、洪水、冰层解冻、火灾等影响日常生活的事件。

将手写记录变为数据
抢救这些信息不仅仅是扫描旧页面。团队建立了一个专门的基于网络的转录系统,能够展示气象登记的数字化图像并将其数字直接输入结构化数据库。他们对不同类型的表格和页面布局进行了编目,使数字录入界面模仿原始表格。志愿者通过受控菜单选择云型和风向以减少输入错误,而像温度和气压这样的数字则由自由文本框处理。每个图像文件都被精心命名,关联到其观测站、日期、观测者和档案馆,以便任何数字值都能追溯到特定页上的特定行。
清洗与核对数值
由于这些观测使用的是旧式仪器且记录习惯各异,原始数字不能直接复制后使用。研究人员对转录数据进行了多层质量检查。首先,专家将数据库表与页面图像进行目视比对,以捕捉明显的错误,例如漏记的日期或小数点位置错误。随后,计算程序扫描不可能或可疑的数值——远超合理范围的温度或超出观测者应使用刻度的风力。对观测者所写的分数、速记符号或省略的前导零,软件会在记录每次更改的同时转换或纠正。团队还对相关测量值之间的一致性进行比对,例如最低温应低于最高温,校正后的气压通常应高于原始站点读数。仍显异常的数值被标记而非删除,以保持记录的完整性。

弥合旧单位与现代标准
另一个重大挑战是十九世纪的观测者并不使用今天的单位。他们以水银英寸记录气压,以华氏度记录温度,以十分之一记录云量,风则混合使用描述性刻度、速度,甚至板上力的磅数。为了使这些记录能与现代气象资料比较,团队将它们转换为国际标准,如摄氏度、百帕和米每秒,依据历史使用说明书和现代换算库进行转换。有些细节,例如旧风标中“清新微风”的确切强度或气象备注的措辞,无法完美翻译,因此这些内容以经过仔细编码的近似值保存,而不是强行归入死板的分类。
观察加拿大数百年气候的新窗口
这项工作的最终成果是由美国国家环境信息中心公开托管的数据集。它包含1768年至1884年间覆盖今加拿大大部的亚日报(sub-daily)记录:温度、气压、风、云、湿度、降水及描述性天气注记等。这些数据将帮助科学家研究历史上的热浪、寒潮、风暴等极端事件,并将纳入使用现代物理模型重建过去天气格局的全球“再分析”项目。对于非专业读者,该项目展示了如何将脆弱且被遗忘的笔记本转变为理解三个世纪以来气候变化的重要工具,以及今天的变化如何与加拿大气象史的整体演变进行比较。
引用: Slonosky, V., Black, R., Podolsky, L. et al. Transcribing historical Canadian weather data. Sci Data 13, 678 (2026). https://doi.org/10.1038/s41597-025-06036-y
关键词: 历史气象数据, 加拿大气候, 数据抢救, 气候极端事件, 气象档案