Clear Sky Science · pl

Prognozowanie trendów temperatury za pomocą wyjaśnialnej sztucznej inteligencji i uczenia maszynowego opartego na PCA: studium przypadku Zonguldak, Turcja

· Powrót do spisu

Dlaczego lokalne trendy temperatury mają znaczenie

Dla wielu społeczności zmiany klimatu mogą wydawać się odległą, globalną opowieścią. Tymczasem ich skutki widać najdotkliwiej w lokalnej pogodzie: cieplejsze lata, przesunięcia w rozkładzie opadów i silniejsze burze. W tym badaniu skupiono się na Zonguldak, prowincji nadmorskiej i przemysłowej nad zachodnim wybrzeżem Morza Czarnego w Turcji, z praktycznym pytaniem: czy nowoczesna sztuczna inteligencja potrafi nie tylko dokładnie prognozować lokalne trendy temperatury, ale także wyjaśnić, jak dochodzi do tych prognoz, tak aby planiści i mieszkańcy mogli im ufać i z nich korzystać?

Przekształcanie surowych zapisów pogodowych w użyteczne wskazówki

Aby odpowiedzieć na to pytanie, badacze zgromadzili ponad dwie dekady miesięcznych zapisów pogodowych dla Zonguldak, obejmujących lata 2000–2022. Zestaw danych zawierał średnią, minimalną i maksymalną temperaturę powietrza, kilka miar opadów, kierunek i prędkość wiatru oraz wilgotność. Zanim jakikolwiek model komputerowy mógł się uczyć na tych danych, zespół je oczyścił i wystandaryzował: uzupełniono brakujące wartości, etykiety tekstowe, takie jak kierunki wiatru, skonwertowano na liczby, a wszystkie zmienne umieszczono na wspólnej skali, by żadna pojedyncza miara nie dominowała jedynie ze względu na jednostki.

Wyodrębnianie skondensowanych wzorców pogodowych

Dane klimatyczne są notorycznie splecione: wiele zmiennych zmienia się razem, a niektóre są silnie powiązane. Aby uprościć tę sieć bez utraty istotnych informacji, badacze zastosowali technikę zwaną analizą głównych składowych (PCA). Zamiast analizować każde pierwotne pomiary oddzielnie, PCA tworzy niewielką liczbę nowych „czynników podsumowujących”, które wychwytują większość zmienności w danych. W tym badaniu zespół zachował wystarczającą liczbę tych czynników, aby zachować 95 procent pierwotnej informacji. Najważniejszy czynnik, znany jako pierwsza składowa główna, okazał się łączyć temperaturę i wiatr w istotny sposób: wyższe temperatury minimalne i maksymalne podnosiły wartość tego czynnika, podczas gdy silniejszy wiatr ją obniżał.

Figure 1
Figure 1.

Wybór najbardziej niezawodnych silników prognostycznych

Mając te uproszczone czynniki klimatyczne, zespół przetestował zestaw metod uczenia maszynowego do prognozowania miesięcznej temperatury średniej. Niektóre były prostymi modelami liniowymi; inne, takie jak sieci neuronowe i drzewa wzmacniane, potrafią wychwycić bardziej złożone zależności. Badacze podzielili dane na zestawy treningowe i testowe oraz ocenili każdą metodę za pomocą kilku miar błędu i dopasowania. Pomimo zainteresowania złożonymi systemami „czarnej skrzynki”, wyraźnymi zwycięzcami okazały się dwie proste metody liniowe: regresja liniowa i regresja grzbietowa (ridge). Modele te konsekwentnie generowały najniższe błędy i wyjaśniały ponad 90 procent zmienności w danych testowych, co pokazuje, że dla tego regionu i tej skali czasowej temperatura zachowuje się w dużej mierze liniowo i przewidywalnie.

Otwieranie czarnej skrzynki decyzji SI

Sama dokładność nie wystarcza, gdy prognozy mają wpływać na planowanie infrastruktury, rolnictwa czy zdrowia publicznego. Aby zrozumieć, dlaczego modele dawały konkretne przewidywania, zespół sięgnął po narzędzia wyjaśnialnej SI. Wytrenowano model oparty na drzewach, dobrze nadający się do takiej analizy, i zastosowano dwie komplementarne metody: „permutation importance”, która mierzy, jak bardzo pogarszają się prognozy po przemieszaniu jednego czynnika, oraz wartości SHAP, które przypisują każdemu czynnikowi wkład do pojedynczej prognozy. Obie metody wskazały tę samą historię: pierwsza składowa główna zdominowała decyzje modelu, z drugorzędnymi rolami kilku innych składowych. Analiza tej wiodącej składowej wykazała, że cieplejsze warunki (wyższe temperatury minimalne i maksymalne) silnie podnoszą prognozowaną temperaturę średnią, podczas gdy szybsze wiatry mają tendencję do jej tłumienia. Wilgotność i opady odgrywały skromniejsze role.

Figure 2
Figure 2.

Co to oznacza dla ludzi i planistów

Mówiąc prosto, badanie wykazuje, że można opracować narzędzia prognozowania temperatury, które są zarówno dokładne, jak i zrozumiałe. Dla Zonguldak proste, dobrze przetestowane modele statystyczne, oparte na starannie wyciągniętych czynnikach klimatycznych, sprawdziły się tak samo dobrze lub lepiej niż bardziej rozbudowane systemy SI. Analizy wyjaśnialności potwierdziły, że modele zachowują się w sposób zgodny z fizyką: silnie reagują na zmiany temperatury i przeciwdziałają im zmiany wiatru. To połączenie wydajności i przejrzystości czyni proponowane podejście obiecującym wzorcem dla innych regionów, które chcą monitorować lokalne trendy klimatyczne i projektować strategie adaptacyjne oparte na wiarygodnych, interpretowalnych dowodach.

Cytowanie: Arslan, R.U., Aksoy, B. & Yapıcı, İ.Ş. Temperature trend prediction with explainable artificial intelligence and PCA based machine learning: a case study of Zonguldak, Turkey. Sci Rep 16, 4910 (2026). https://doi.org/10.1038/s41598-026-35173-6

Słowa kluczowe: prognozowanie temperatury, zmiany klimatu, uczenie maszynowe, wyjaśnialna SI, analiza głównych składowych