Clear Sky Science · pl

Analiza porównawcza modeli uczenia maszynowego z interpretacją SHAP dla przyczyn zablokowań dróg krajowych spowodowanych powodziami

· Powrót do spisu

Dlaczego zalane autostrady mają znaczenie dla codziennego życia

Kiedy ulewny deszcz zmywa drogę lub wywołuje osuwisko, może unieruchomić podróżnych, opóźnić służby ratunkowe i zakłócić przepływ żywności oraz towarów. W prowincji Syczuan w Chinach takie zablokowania autostrad związane z powodziami stają się coraz częstsze wraz z nasilaniem się ekstremalnych zjawisk pogodowych i rozrostem sieci drogowej. Badanie stawia praktyczne pytanie o znaczeniu globalnym: czy nowoczesna sztuczna inteligencja może przewidywać, kiedy i gdzie autostrady najpewniej zostaną odcięte przez powodzie, i czy może wyjaśnić, dlaczego tak się dzieje?

Mapowanie wrażliwego regionu górskiego

Syczuan, rozległa prowincja na południowym zachodzie Chin, wybrana została jako pole badań, ponieważ łączy rozbudowaną sieć dróg z surowym terenem i intensywnymi deszczami sezonowymi. Badacze zgromadzili bogaty zestaw danych za lata 2021–2022, obejmujący prawie 9 000 codziennych zapisów zablokowań dróg spowodowanych powodziami, informacje o wysokości i nachyleniu terenu z danych satelitarnych, pokrywie roślinnej, użytkowaniu gruntów, rzekach i potokach, opadach i temperaturze oraz gęstości zaludnienia i dróg. Skoncentrowali się na głównych trasach — autostradach oraz drogach krajowych i prowincjonalnych — tam, gdzie zamknięcia powodują największe skutki społeczne i gospodarcze. Aby zachować realizm danych, musieli zmierzyć się z powszechnym problemem: dni bez zdarzeń zablokowania znacznie przeważały nad dniami, w których drogi były faktycznie odcięte.

Figure 1
Figure 1.

Nauczanie maszyn rozpoznawania zagrożeń

Zespół zbudował zintegrowane ramy łączące trzy idee: inteligentniejsze traktowanie rzadkich zdarzeń, staranne porównanie metod predykcyjnych oraz przejrzyste wyjaśnienia czynników ryzyka. Ponieważ zdarzenia zablokowań są stosunkowo rzadkie, tradycyjne modele mają tendencję do „uczenia się” głównie z wielu bezpiecznych dni i nie rozpoznają tych nielicznych dni niebezpiecznych. Aby przeciwdziałać tej nierównowadze, badacze porównali trzy strategie. Jedna po prostu usuwała część dni bez zablokowań (undersampling). Druga używała techniki zwanej TimeGAN, która uczy się wzorców w rzeczywistych szeregach czasowych, a następnie generuje realistyczne syntetyczne przykłady rzadkich dni zablokowań, aby wzmocnić klasę mniejszościową. Trzecie, hybrydowe podejście łączyło obie idee. Na bazie tych wstępnie przetworzonych zestawów danych trenowano sześć różnych modeli uczenia maszynowego, od znanych metod takich jak regresja logistyczna i maszyny wektorów nośnych, po bardziej elastyczne metody, takie jak lasy losowe, gradient boosting i wielowarstwowe perceptrony (rodzaj sieci neuronowej). Oceniano je głównie pod kątem równowagi między wykrywaniem prawdziwych zdarzeń zablokowań a unikaniem fałszywych alarmów.

Wybór najlepszego predyktora i testowanie jego niezawodności

Wśród dziesiątek kombinacji modeli i danych wybiło się jedno zestawienie: wielowarstwowy perceptron trenowany na danych rozszerzonych metodą TimeGAN. Ta konfiguracja osiągnęła najwyższy wynik F1 (około 50%) oraz konkurencyjną wydajność w miarach precyzji–odwołania, co oznacza, że najlepiej identyfikowała dni z zablokowaniami bez bycia przytłoczonymi przez fałszywe pozytywy. Co ważne, wyniki modelu na niewidzianych danych testowych były zbliżone do wyników podczas treningu, a specjalny test bootstrapowy, który przetasowywał uporządkowane czasowo bloki, wykazał, że jego wydajność była stabilna, a nie przypadkowa. Innymi słowy, stworzenie realistycznych dodatkowych przykładów rzadkich zdarzeń zablokowań pomogło sieci neuronowej nauczyć się użytecznych wzorców bez przeuczenia na szumie.

Figure 2
Figure 2.

Co model ujawnia o warunkach ryzyka

Aby wyjść poza prognozy „czarnej skrzynki”, autorzy zastosowali metodę SHAP do zbadania wytrenowanej sieci neuronowej i ustalenia, które czynniki były najważniejsze i w jaki sposób. Analiza uwypukliła niewielki zestaw progów pogodowych i lokalizacyjnych, które gwałtownie zwiększają ryzyko zablokowania. Dzienne opady powyżej około 2,8 milimetra oraz siedmiodniowe narastanie efektywnego opadu powyżej około 22 milimetrów wyznaczają punkty zwrotne: poniżej tych wartości warunki raczej ograniczają zablokowania; powyżej nich prawdopodobieństwo szybko rośnie, gdy gleby się nasycają, a spływ eroduje zbocza i podbudowy dróg. Temperatura odgrywa podobną rolę. Gdy średnie dobowe temperatury pozostają poniżej mniej więcej 21 stopni Celsjusza, ryzyko jest zwykle niskie, ale cieplejsze warunki często idą w parze z intensywniejszymi opadami i mokrzejszym gruntem, co wspólnie sprzyja osunięciom i podmyciom. Mniej oczywistym czynnikiem jest odległość drogi od najbliższego potoku. Gdy średnia odległość droga–rzeka w pasie kilometrowym przekracza około 0,15 kilometra, ryzyko rośnie — prawdopodobnie dlatego, że takie drogi częściej leżą na stromych, bardziej podatnych na awarie zboczach zamiast na łagodniejszych dnach dolin.

Przekuwanie wnikliwości w bezpieczniejsze drogi

Dla odbiorców nietechnicznych sedno jest proste: określone kombinacje „zbyt dużo wody, zbyt długo, w nieodpowiednim terenie” znacząco zwiększają szanse na zablokowanie autostrady. Precyzując progi opadów, temperatury i odległości drogi od rzek oraz wykazując, że starannie dostrojona sieć neuronowa może przewidywać dni ryzykowne z rozsądną dokładnością, badanie daje praktyczne wskazówki dla zarządców dróg. Wnioski te mogą zasilać panele wczesnego ostrzegania, wskazywać miejsca do wzmacniania zboczy lub odwodnienia oraz pomagać priorytetyzować odcinki długich sieci drogowych do monitoringu i konserwacji. W miarę jak ekstremalna pogoda staje się częstsza, takie oparte na danych, dające wyjaśnienia narzędzia mogą odgrywać kluczową rolę w utrzymaniu otwartych tras transportowych i łączności społeczności.

Cytowanie: Li, B., Wu, L., Gao, J. et al. Comparative analysis of machine learning models with SHAP interpretation for causes of highway flood-damage blocking. Sci Rep 16, 5118 (2026). https://doi.org/10.1038/s41598-026-35074-8

Słowa kluczowe: ryzyko powodzi na drogach, uczenie maszynowe, ekstremalne opady, odporność infrastruktury, osuwiska