Clear Sky Science · de
Vorhersage von Temperaturtrends mit erklärbarer künstlicher Intelligenz und PCA-basierendem maschinellen Lernen: Eine Fallstudie von Zonguldak, Türkei
Warum lokale Temperaturtrends wichtig sind
Für viele Gemeinden kann sich der Klimawandel wie eine entfernte, globale Erzählung anfühlen. Seine Folgen treten jedoch am deutlichsten im lokalen Wetter zutage: heißere Sommer, veränderte Niederschlagsmuster und heftigere Stürme. Diese Studie konzentriert sich auf Zonguldak, eine Küsten- und Industrieregion an der westlichen Schwarzmeerküste der Türkei, und stellt eine praktische Frage: Kann moderne künstliche Intelligenz lokale Temperaturtrends nicht nur genau vorhersagen, sondern auch erklären, wie sie zu diesen Vorhersagen gelangt, sodass Planer und Einwohner den Ergebnissen vertrauen und sie nutzen können?
Rohwetterdaten in verwertbare Hinweise verwandeln
Um diese Frage zu untersuchen, sammelten die Forschenden mehr als zwei Jahrzehnte monatlicher Wetteraufzeichnungen für Zonguldak, die Jahre 2000 bis 2022 abdeckend. Der Datensatz umfasste Mittel-, Minimal- und Maximaltemperatur, mehrere Niederschlagsmaße, Windrichtung und -geschwindigkeit sowie Luftfeuchtigkeit. Bevor ein Computermodell aus diesen Daten lernen konnte, bereinigte und standardisierte das Team sie: Fehlende Werte wurden ergänzt, Textangaben wie Windrichtungen in Zahlen überführt und alle Variablen auf eine gemeinsame Skala gebracht, damit keine Messgröße allein aufgrund ihrer Einheiten die anderen dominierte.
Komplexe Wettermuster destillieren
Klimadaten sind berüchtigt dafür, stark verflochten zu sein: Viele Variablen ändern sich gemeinsam, und einige sind eng miteinander verknüpft. Um dieses Geflecht zu vereinfachen, ohne wichtige Informationen zu verlieren, nutzten die Forschenden eine Technik namens Hauptkomponentenanalyse (PCA). Anstatt jede ursprüngliche Messgröße einzeln zu betrachten, erzeugt PCA eine kleine Anzahl neuer „Zusammenfassungs“-Faktoren, die den Großteil der Variation in den Daten erfassen. In dieser Studie behielt das Team so viele dieser Faktoren bei, dass 95 Prozent der ursprünglichen Informationen erhalten blieben. Der wichtigste Faktor, die erste Hauptkomponente, verband Temperatur und Wind auf sinnvolle Weise: Höhere Minimal- und Maximaltemperaturen erhöhten diesen Faktor, während stärkere Winde ihn senkten.

Die zuverlässigsten Vorhersage-Modelle auswählen
Mit diesen kompakten Klimafaktoren testete das Team eine Reihe von Methoden des maschinellen Lernens zur Vorhersage der monatlichen Durchschnittstemperatur. Einige waren einfache Modelle mit gerader Linie; andere, wie neuronale Netze und Gradient-Boosting-Bäume, können komplexere Zusammenhänge erfassen. Die Forschenden teilten die Daten in Trainings- und Testmengen und bewerteten jede Methode mit mehreren Fehler- und Gütemaßen. Trotz des Hypes um komplexe „Black-Box“-Systeme waren die klaren Gewinner hier zwei einfache lineare Ansätze, genannt lineare Regression und Ridge-Regression. Diese Modelle erzielten durchweg die geringsten Fehler und erklärten mehr als 90 Prozent der Variation in den Testdaten, was zeigt, dass die Temperatur in dieser Region und auf dieser Zeitskala weitgehend linear und vorhersagbar verhält.
Die Black Box der KI-Entscheidungen öffnen
Alleinige Genauigkeit reicht nicht, wenn Vorhersagen Infrastrukturen, Landwirtschaft oder Gesundheitsplanung informieren sollen. Um nachzuvollziehen, warum die Modelle bestimmte Vorhersagen machten, wandte das Team erklärbare-KI-Werkzeuge an. Sie trainierten ein baumbasiertes Modell, das sich gut für eine solche Analyse eignet, und nutzten zwei komplementäre Methoden: „Permutation Importance“, das misst, wie stark die Vorhersagen sich verschlechtern, wenn ein Faktor zufällig vertauscht wird, und SHAP-Werte, die jedem Faktor einen Beitrag zu jeder einzelnen Vorhersage zuweisen. Beide Ansätze erzählten dieselbe Geschichte: Die erste Hauptkomponente dominierte die Modellentscheidungen, mit sekundären Rollen für einige weitere Komponenten. Ein Blick darauf, wie dieser führende Faktor zusammengesetzt ist, zeigte, dass wärmere Bedingungen (höhere Minimal- und Maximaltemperaturen) die vorhergesagte Durchschnittstemperatur stark anheben, während stärkere Winde sie tendenziell dämpfen. Luftfeuchtigkeit und Niederschlag spielten eher geringere Rollen.

Was das für Menschen und Planer bedeutet
Einfach gesagt zeigt die Studie, dass es möglich ist, Temperaturvorhersage-Tools zu entwickeln, die sowohl genau als auch nachvollziehbar sind. Für Zonguldak schnitten einfache, gut geprüfte statistische Modelle, gestützt auf sorgfältig destillierte Klimafaktoren, ebenso gut oder besser ab als aufwändigere KI-Systeme. Die Erklärbarkeitsanalysen bestätigten, dass sich die Modelle physikalisch sinnvoll verhalten: Sie reagieren stark auf Temperaturänderungen und ausgleichend auf Wind. Diese Kombination aus Leistungsfähigkeit und Transparenz macht das Framework zu einem vielversprechenden Vorbild für andere Regionen, die lokale Klimatrends überwachen und Anpassungsstrategien auf Grundlage vertrauenswürdiger, interpretierbarer Evidenz entwerfen möchten.
Zitation: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6
Schlüsselwörter: Temperaturvorhersage, Klimawandel, maschinelles Lernen, erklärbare KI, Hauptkomponentenanalyse