Clear Sky Science · nl
Temperatuurtrendvoorspelling met uitlegbare kunstmatige intelligentie en PCA-gebaseerde machine learning: een casestudy van Zonguldak, Turkije
Waarom lokale temperatuurtrends ertoe doen
Voor veel gemeenschappen kan klimaatverandering aanvoelen als een verafgelegen, wereldwijd verhaal. Toch komen de effecten het duidelijkst naar voren in het lokale weer: warmere zomers, verschuivende neerslagpatronen en intensere stormen. Deze studie richt zich op Zonguldak, een kust- en industrieprovincie aan de westelijke Zwarte Zee van Turkije, en stelt een praktische vraag: kunnen moderne kunstmatige intelligentie niet alleen lokale temperatuurtrends nauwkeurig voorspellen, maar ook uitleggen hoe die voorspellingen tot stand komen, zodat planners en bewoners de resultaten kunnen vertrouwen en gebruiken?
Ruwe weerrecords omzetten in bruikbare aanwijzingen
Om deze vraag te beantwoorden verzamelden de onderzoekers meer dan twee decennia aan maandelijkse weergegevens voor Zonguldak, die de jaren 2000 tot 2022 bestrijken. De dataset omvatte gemiddelde, minimum- en maximumtemperatuur, verschillende neerslagmetingen, windrichting en -snelheid, en luchtvochtigheid. Voordat een computermodel van deze gegevens kon leren, schonk het team ze: ontbrekende waarden werden ingevuld, tekstlabels zoals windrichtingen werden omgezet in cijfers, en alle variabelen werden genormaliseerd zodat geen enkele meting de anderen zou overheersen louter door zijn eenheden.
Complexe weerspatronen distilleren
Klimaatgegevens zijn berucht om hun complexiteit: veel variabelen veranderen samen en sommige zijn sterk met elkaar verbonden. Om dit web te vereenvoudigen zonder belangrijke informatie te verliezen, gebruikten de onderzoekers een techniek genaamd principale componentenanalyse (PCA). In plaats van naar elke oorspronkelijke meting afzonderlijk te kijken, creëert PCA een klein aantal nieuwe ‘samenvattende’ factoren die het grootste deel van de variatie in de data vastleggen. In deze studie hield het team genoeg van deze factoren aan om 95 procent van de oorspronkelijke informatie te behouden. De belangrijkste factor, bekend als de eerste principale component, bleek temperatuur en wind op betekenisvolle wijze te combineren: hogere minimum- en maximumtemperaturen duwden deze factor omhoog, terwijl sterkere wind deze juist naar beneden trok.

De meest betrouwbare voorspellingsmodellen kiezen
Met deze gestroomlijnde klimaatfactoren testte het team een reeks machine learning-methoden om de maandelijkse gemiddelde temperatuur te voorspellen. Sommige waren eenvoudige lineaire modellen; andere, zoals neurale netwerken en boosted trees, kunnen complexere relaties vastleggen. De onderzoekers splitsten de data in trainings- en testsets en evalueerden elke methode met verschillende fout- en goodness-of-fitmaten. Ondanks de aandacht voor complexe ‘black box’-systemen, waren de duidelijke winnaars hier twee eenvoudige lineaire benaderingen, genaamd lineaire regressie en ridge-regressie. Deze modellen produceerden consequent de laagste fouten en verklaarden meer dan 90 procent van de variatie in de testdata, wat aantoont dat, voor deze regio en tijdschaal, temperatuur zich grotendeels lineair en voorspelbaar gedraagt.
Het zwarte doos van AI-beslissingen openen
Alleen nauwkeurigheid is niet genoeg wanneer voorspellingen infrastructuur, landbouw of gezondheidsplanning informeren. Om te begrijpen waarom de modellen bepaalde voorspellingen deden, gebruikte het team uitlegbare AI-instrumenten. Ze trainden een boomgebaseerd model dat zich goed leent voor dergelijke analyse en pasten twee complementaire methoden toe: “permutation importance”, die meet hoeveel de voorspellingen verslechteren wanneer één factor wordt geschud, en SHAP-waarden, die elke factor een bijdrage toekennen aan elke individuele voorspelling. Beide benaderingen wezen naar hetzelfde verhaal: de eerste principale component domineerde de modelbeslissingen, met een secundaire rol voor enkele andere componenten. Terugkijkend op hoe deze leidende factor is opgebouwd, toonde de analyse dat warmere omstandigheden (hogere minimum- en maximumtemperaturen) de voorspelde gemiddelde temperatuur sterk verhogen, terwijl snellere windsnelheden deze neigen te onderdrukken. Luchtvochtigheid en neerslag speelden een meer bescheiden rol.

Wat dit betekent voor mensen en planners
In eenvoudige bewoordingen toont de studie aan dat het mogelijk is temperatuurvoorspellingshulpmiddelen te bouwen die zowel nauwkeurig als begrijpelijk zijn. Voor Zonguldak presteerden eenvoudige, goed geteste statistische modellen, geleid door zorgvuldig gedistilleerde klimaatfactoren, net zo goed of beter dan meer geavanceerde AI-systemen. De uitlegbaarheidsanalyses bevestigden dat de modellen zich op een fysiek zinvolle manier gedragen: ze reageren sterk op temperatuurschommelingen en op een tegengestelde manier op wind. Deze combinatie van prestatie en transparantie maakt het raamwerk tot een veelbelovend model voor andere regio’s die lokale klimaattrends willen monitoren en adaptatiestrategieën willen ontwerpen op basis van betrouwbare, interpreteerbare gegevens.
Bronvermelding: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6
Trefwoorden: temperatuurvoorspelling, klimaatverandering, machine learning, uitlegbare AI, principale componentenanalyse