Clear Sky Science · nl

Het transcriberen van historische Canadese weersgegevens

· Terug naar het overzicht

Waarom oud weer vandaag nog steeds belangrijk is

Als we aan klimaatverandering denken, zien we meestal satellieten, supercomputers en moderne weerstations voor ons. Maar om echt te begrijpen hoe ons klimaat over eeuwen is veranderd, moeten wetenschappers veel verder terug in de tijd—naar een wereld van inkt, papier en zorgvuldige dagelijkse aantekeningen. Deze studie beschrijft hoe bijna twee miljoen handgeschreven weerwaarnemingen uit wat nu Canada is, vastgelegd tussen 1768 en 1884, met veel zorg zijn omgezet in digitale gegevens die computers kunnen lezen en die door klimaatmodellen gebruikt kunnen worden.

Verborgen weer in oude papieren archieven

Vóórdat nationale weersdiensten bestonden, schreven militaire officieren, artsen, leraren en andere vrijwilligers in Brits-Noord-Amerika de dagelijkse weersomstandigheden zorgvuldig op. Hun notitieboeken en voorgedrukte formulieren belandden in archieven in de Verenigde Staten en het Verenigd Koninkrijk in plaats van in Canada. Het NORTHERN-project (Nineteenth-century Overseas Records Transcribed for Historical Environmental Reconstruction in the North) zette zich in om deze verspreide gegevens te vinden en te redden. Werkend vooral met microfilmkopieën uit Amerikaanse en Britse archieven, identificeerde het team 46 locaties—van Atlantische havens tot afgelegen handelsplaatsen in het noordwesten—waar waarnemers drie tot twintig weervariabelen noteerden, vaak meerdere keren per dag. Deze aantekeningen registreren niet alleen temperatuur en druk, maar ook stormen, overstromingen, ijsgang, branden en andere gebeurtenissen die het dagelijks leven bepaalden.

Figure 1
Figure 1.

Handgeschrevening omzetten naar data

Het redden van deze informatie was meer dan alleen oude pagina’s scannen. Het team bouwde een speciaal webgebaseerd transcriptiesysteem waarin gedigitaliseerde afbeeldingen van weerregisters konden worden weergegeven en de getallen rechtstreeks in een gestructureerde database konden worden getypt. Ze classificeerden verschillende soorten formulieren en paginalay-outs, zodat de digitale invoerschermen de originele tabellen nabootsten. Vrijwilligers kozen wolkensoorten en windrichtingen uit gecontroleerde menu’s om typfouten te beperken, terwijl vrije-tekstvakken getallen zoals temperatuur en druk opvingen. Elk afbeeldingsbestand kreeg een zorgvuldig ontworpen naam die het koppelde aan het station, de datum, de waarnemer en het archief, zodat elke digitale waarde altijd terug te herleiden is tot een specifieke regel op een specifieke pagina.

De cijfers opschonen en controleren

Omdat deze waarnemingen met oudere instrumenten en uiteenlopende gewoonten waren gedaan, konden de ruwe cijfers niet zomaar worden overgenomen en gebruikt. De onderzoekers lieten de getranscribeerde gegevens verschillende kwaliteitscontroles doorlopen. Eerst vergeleken specialisten visueel de databasetabellen met de paginabeelden om duidelijke fouten zoals ontbrekende dagen of verschoven komma’s te vinden. Daarna scanden computerprogramma’s op onmogelijke of verdachte waarden—temperaturen ver buiten elke redelijke marge, of windkrachten buiten de schaal die de waarnemer geacht werd te gebruiken. Waar waarnemers breuken, afkortingen of weggelaten voorloopnullen hadden geschreven, zette de software deze om of corrigeerde ze en registreerde elke wijziging. Het team vergeleek ook gerelateerde metingen met elkaar; bijvoorbeeld minimumtemperaturen moeten lager zijn dan maximumtemperaturen, en gecorrigeerde luchtdruk zou doorgaans hoger moeten zijn dan de ruwe stationwaardes. Waarden die nog steeds vreemd leken, werden gemarkeerd in plaats van verwijderd, waardoor het register integer bleef.

Figure 2
Figure 2.

Een brug tussen oude eenheden en moderne standaarden

Een andere grote uitdaging was dat negentiende-eeuwse waarnemers niet in de eenheden dachten die we nu gebruiken. Zij noteerden druk in inches kwik, temperatuur in graden Fahrenheit, wolkendekking in tienden en wind in een mengeling van beschrijvende schalen, snelheden en zelfs ponden kracht op een plaat. Om deze registers vergelijkbaar te maken met moderne weergegevens, zette het team ze om naar internationale standaarden zoals graden Celsius, hectopascal en meters per seconde, met behulp van historische instructiehandleidingen en moderne conversiebibliotheken. Sommige details, zoals de precieze sterkte van een ‘lichte bries’ op een oude windladder of de formulering van weeropmerkingen, zijn niet perfect te vertalen; deze worden daarom bewaard als zorgvuldig gecodeerde benaderingen in plaats van geforceerd in nette categorieën te passen.

Een nieuw venster op eeuwen Canadees weer

Het eindresultaat van deze inspanning is een publiek beschikbare dataset die wordt gehost door de U.S. National Centers for Environmental Information. Het omvat subdagelijkse registraties van temperatuur, druk, wind, wolken, luchtvochtigheid, neerslag en beschrijvende weersopmerkingen van 1768 tot 1884 over grote delen van het huidige Canada. Deze gegevens helpen wetenschappers om lang geleden optredende hittegolven, koudegolven, stormen en andere extreme gebeurtenissen te bestuderen, en ze voeden mondiale “reanalyses” die verleden weerpatronen reconstrueren met moderne natuurkundig gebaseerde modellen. Voor niet-specialisten laat het project zien hoe fragiele, vergeten notitieboekjes kunnen worden omgevormd tot krachtige middelen om te begrijpen hoe ons klimaat over drie eeuwen varieerde—en hoe de veranderingen van vandaag zich verhouden tot de gehele geschiedenis van Canada’s weer.

Bronvermelding: Slonosky, V., Black, R., Podolsky, L. et al. Transcribing historical Canadian weather data. Sci Data 13, 678 (2026). https://doi.org/10.1038/s41597-025-06036-y

Trefwoorden: historische weersgegevens, Canadese klimaat, gegevensredding, klimaatexremen, weerkonservatoria