Clear Sky Science · pl
Prognozowanie jakości wód powierzchniowych za pomocą hybrydowej sieci neuronowej MLA‑Mamba z optymalizacją GRPO
Dlaczego warto przewidywać stan rzek
Rzeki i jeziora dostarczają nam wodę pitną, zasoby do nawadniania oraz siedliska dla dzikiej przyrody. Ich jakość może jednak szybko się zmieniać, gdy zanieczyszczenia spływają z gospodarstw, fabryk czy miast. Organy nadzorcze często dowiadują się o problemie dopiero po wyrządzeniu szkody. Badanie to pokazuje, jak nowoczesna sztuczna inteligencja może pełnić rolę inteligentnego systemu wczesnego ostrzegania, przewidując zmiany jakości wody na kilka dni naprzód, dając menedżerom czas na reakcję.
Stare narzędzia, nowe problemy
Od dekad naukowcy próbują prognozować jakość wody, używając równań matematycznych i tradycyjnych metod statystycznych. Metody te albo szczegółowo symulują chemię i przepływ, albo dopasowują przeszłe pomiary za pomocą relatywnie prostych krzywych. Oba podejścia mają trudności z chaotyczną rzeczywistością rzek, gdzie pogoda, zrzuty z górnych odcinków i aktywność biologiczna wzajemnie się zazębiają w złożony, nieliniowy sposób. Często nie wychwytują nagłych skoków zanieczyszczeń ani nie uwzględniają, jak warunki w jednej stacji monitorującej wpływają na stacje poniżej. W efekcie prognozy bywają zbyt uproszczone, by można było na nich polegać przy podejmowaniu decyzji.
Nauczanie sieci neuronowej „czytania” rzeki
Autorzy proponują nowy model głębokiego uczenia, nazwany MLA‑Mamba, zaprojektowany specjalnie dla tego splotu przestrzeni i czasu. Zamiast analizować pojedynczy czujnik w izolacji, model przetwarza tygodniowy zbiór godzinnych danych z wielu stacji monitorujących wraz z dodatkowymi informacjami, takimi jak temperatura wody, przepływ i kwasowość. Następnie uczy się przewidywać cztery kluczowe wskaźniki sygnalizujące zanieczyszczenia organiczne i ładunki pokarmowe: chemiczne zapotrzebowanie na tlen (CODMn), amoniak (NH3–N), fosfor ogólny (TP) oraz azot ogólny (TN). Model łączy dwa wyspecjalizowane komponenty. Jeden koncentruje się na wzorcach w czasie, wykrywając cykle, powolne dryfy i opóźnione efekty. Drugi patrzy przestrzennie, ucząc się, jak stacje nadrzędne i sąsiadujące poruszają się razem. Poprzez fuzję tych perspektyw sieć buduje pełniejszy obraz ewolucji jakości wody.

Wyłapywanie trendów czasowych i wpływu z górnych części zlewni
W ramach MLA‑Mamba moduł „Mamba” skupia się na historii czasowej. Przeszukuje długie sekwencje pomiarów, korzystając z idei modeli stanu oraz współczesnych sieci rekurencyjnych, aby zachować informacje sprzed kilku dni bez przeciążenia pamięci. To pomaga rozpoznawać wzorce sezonowe i długotrwałe skutki wcześniejszych zaburzeń. Równolegle moduł „Multi‑Head Local Attention” ocenia, jak silnie każda stacja wiąże się z innymi w danym momencie, z wbudowanym uprzedzeniem wobec pobliskich stacji w tym samym odcinku rzeki. Jeśli stacja z górnego biegu nagle odnotuje skok amoniaku, mechanizm uwagi może szybko przesunąć fokus na ten sygnał przy przewidywaniu warunków poniżej. Wielozadaniowe ustawienie pozwala modelowi uczyć się wszystkich czterech wskaźników jednocześnie, tak że zmiany jednego zanieczyszczenia mogą informować oczekiwania dotyczące pozostałych.
Mądrzejsze uczenie na zaszumionych danych środowiskowych
Trenowanie takiej sieci na rzeczywistych zapisach z czujników jest trudne: dane są zaszumione, występują luki, a standardowe metody optymalizacji mogą utknąć. Aby temu zaradzić, badacze wprowadzają niestandardową strategię treningową nazwaną Gradient Reparameterization Optimization (GRPO). GRPO dostosowuje tempo uczenia każdego parametru w sieci na podstawie zachowania jego gradientu w czasie, przyspieszając w stabilnych kierunkach i zwalniając, gdy aktualizacje zaczynają oscylować. Wprowadza też minimalny krok, aby uczenie nie zamarło na płaskich fragmentach powierzchni błędu. Zespół dodatkowo stosuje dropout nie tylko by zapobiegać przeuczeniu, lecz także do oszacowania niepewności — uruchamiając model wielokrotnie i badając, jak bardzo jego przewidywania się różnią. To daje pasma ufności wokół każdej prognozy, dając menedżerom wyobrażenie o wiarygodności konkretnego przewidywania.

Testy modelu
Autorzy oceniają MLA‑Mamba na kilkuletnich godzinnych danych z dwóch stacji rzecznych w Chinach, jednej położonej powyżej drugiej. Model bierze poprzednie siedem dni danych i prognozuje kolejne trzy dni. Porównano go z ośmioma alternatywami, od klasycznych metod statystycznych po współczesne architektury głębokiego uczenia, takie jak sieci LSTM, hybrydy splotowo‑rekurencyjne oraz modele Transformer. We wszystkich czterech wskaźnikach i w obu lokalizacjach MLA‑Mamba konsekwentnie osiąga najniższe błędy predykcji. W wielu przypadkach redukuje typowe błędy o 10–20 procent w porównaniu z mocnymi bazami głębokiego uczenia. Gdy w kontrolowanych testach wyłączano części modelu — usuwając uwagę przestrzenną, zastępując moduł Mamba standardowym LSTM, wyłączając optymalizator GRPO lub trenując każdy wskaźnik osobno — wydajność wyraźnie się pogarszała. Pokazuje to, że każdy składnik wnosi wkład w osiągane korzyści.
Co to oznacza dla ochrony zasobów wodnych
Mówiąc prosto, badanie dowodzi, że dopasowana hybrydowa sieć neuronowa może dostarczać dokładniejsze i bardziej wiarygodne krótkoterminowe prognozy zanieczyszczeń rzecznych niż obecne standardowe narzędzia. Śledząc jednocześnie wiele zanieczyszczeń na wielu stacjach oraz kwantyfikując własną pewność, ramy MLA‑Mamba mogą stać się podstawą systemów wczesnego ostrzegania, które uruchamiają inspekcje lub czasowe ograniczenia zanim zostaną przekroczone progi. Choć podejście nadal zależy od wysokiej jakości danych monitorujących i wymaga testów na większej liczbie rzek oraz podczas ekstremalnych zdarzeń, oferuje obiecującą drogę ku inteligentniejszemu, opartemu na danych zarządzaniu wodami powierzchniowymi.
Cytowanie: Wei, R., Chen, H. & Wang, H. Surface water quality prediction via an MLA-Mamba hybrid neural network with GRPO optimization. Sci Rep 16, 5845 (2026). https://doi.org/10.1038/s41598-026-36229-3
Słowa kluczowe: prognozowanie jakości wody, zanieczyszczenie rzek, głębokie uczenie, modelowanie przestrzenno‑czasowe, monitoring środowiska