Clear Sky Science · ru

Прогноз качества поверхностных вод с помощью гибридной нейронной сети MLA-Mamba с оптимизацией GRPO

2026-01-20 · Назад к списку

Почему важно предсказывать состояние рек

Реки и озёра служат источниками питьевой воды, орошения и местообитаниями для дикой природы. Тем не менее их качество может быстро меняться, когда в воду попадает загрязнение с полей, заводов или из городов. Власти часто узнают об этом только после нанесения ущерба. В этом исследовании рассматривается, как современные методы искусственного интеллекта могут выступать в роли интеллектуальной системы раннего предупреждения, прогнозируя изменения качества воды за несколько дней и давая менеджерам время на реагирование.

Старые инструменты, новые задачи

Долгое время учёные пытались прогнозировать качество воды с помощью математических моделей и традиционной статистики. Эти методы либо подробно моделируют химию и поток, либо аппроксимируют прошлые наблюдения относительно простыми кривыми. Обе стратегии испытывают трудности с беспорядочной реальностью рек, где погода, сбросы вверх по течению и биологическая активность взаимодействуют сложно и нелинейно. Они часто пропускают резкие всплески загрязнения или не учитывают, как состояния на одной контрольной точке передаются вниз по течению в другую. В результате прогнозы оказываются слишком грубыми для уверенного принятия решений.

Обучение нейросети «читать» реку

Авторы предлагают новую модель глубокого обучения, названную MLA-Mamba, специально разработанную для этой спутанной пространственно-временной задачи. Вместо того чтобы рассматривать отдельный датчик в изоляции, модель принимает недельный объём почасовых данных с нескольких стаций вместе со вспомогательной информацией, такой как температура воды, расход и кислотность. Затем она учится предсказывать четыре ключевых показателя, сигнализирующих об органическом загрязнении и поступлении питательных веществ: индекс химического потребления кислорода (CODMn), аммиак (NH3–N), общий фосфор (TP) и общий азот (TN). Модель объединяет два специализированных компонента. Один ориентирован на временные шаблоны, обнаруживая циклы, медленные сдвиги и отложенные эффекты. Другой анализирует пространство, изучая, как станции вверх по течению и соседние друг с другом меняются совместно. Сливая эти представления, сеть строит более полную картину эволюции качества воды.

Учет временных тенденций и влияния вверх по течению

Внутри фреймворка MLA-Mamba модуль «Mamba» сосредоточен на временной составляющей. Он просматривает длинные последовательности измерений, используя идеи из моделей состояния и современных рекуррентных сетей, чтобы сохранять информацию о событиях дней назад, не перегружаясь. Это помогает распознавать сезонные шаблоны и длительные последствия прошлых нарушений. Параллельно модуль «Мультиголовное локальное внимание» оценивает, насколько сильно каждая станция связана с остальными в данный момент, с встроенным смещением в сторону близких участков в одном гидрографическом разрезе. Если на верхней станции вдруг фиксируется рост аммиака, механизм внимания может быстро переключиться на этот сигнал при прогнозировании условий ниже по течению. Многозадачная настройка позволяет модели одновременно учить все четыре показателя качества воды, так что изменения одного загрязнителя могут информировать ожидания по другим.

Более умное обучение для шумных экологических данных

Обучение такой модели на реальных данных с датчиков непросто: данные шумные, имеются пропуски, и стандартные методы оптимизации могут застрять. Чтобы справиться с этим, исследователи вводят собственную стратегию обучения под названием Gradient Reparameterization Optimization (GRPO). GRPO регулирует скорость обучения каждого параметра сети в зависимости от поведения его градиента во времени: примерно ускоряя шаги в стабильных направлениях и замедляя, когда обновления начинают колебаться. Он также устанавливает минимальный размер шага, чтобы обучение не останавливалось на плоских участках поверхности ошибки. Команда дополнительно использует dropout не только чтобы предотвратить переобучение, но и для оценки неопределённости — прогоняя модель несколько раз и анализируя разброс прогнозов. Это даёт интервалы доверия вокруг каждого прогноза, позволяя менеджерам оценить надёжность конкретного предсказания.

Тестирование модели

Авторы оценивают MLA-Mamba на нескольких годах почасовых данных с двух станций на реке в Китае, расположенных одна выше другой. Модель принимает предыдущие семь дней данных и предсказывает следующие три дня. Её сравнивают с восемью альтернативами — от классических статистических методов до современных архитектур глубокого обучения, таких как сети с долговременной кратковременной памятью (LSTM), сверточно-рекуррентные гибриды и модели Transformer. По всем четырём показателям и в обеих точках MLA-Mamba стабильно показывает наименьшие ошибки прогнозирования. Во многих случаях она сокращает типичные ошибки на 10–20 процентов по сравнению с сильными глубокими базовыми решениями. При отключении частей модели в контролируемых тестах — удаления пространственного внимания, замены модуля Mamba стандартным LSTM, отключения оптимизатора GRPO или обучения каждого показателя по отдельности — качество заметно ухудшается. Это показывает, что каждый компонент вносит вклад в полученный выигрыш.

Что это значит для охраны водных ресурсов

Проще говоря, исследование демонстрирует, что специализированная гибридная нейронная сеть может давать более точные и надёжные краткосрочные прогнозы загрязнения рек, чем стандартные сегодня инструменты. Одновременное отслеживание нескольких загрязнителей на нескольких станциях и количественная оценка уверенности в собственных предсказаниях позволяют фреймворку MLA-Mamba служить основой систем раннего предупреждения, запускающих проверки или временные ограничения до превышения порогов. Хотя подход по-прежнему зависит от качественных данных мониторинга и требует испытаний на других реках и в экстремальных ситуациях, он предлагает перспективный путь к более разумному, управляемому данными управлению поверхностными водами.

Цитирование: Wei, R., Chen, H. & Wang, H. Surface water quality prediction via an MLA-Mamba hybrid neural network with GRPO optimization. Sci Rep 16, 5845 (2026). https://doi.org/10.1038/s41598-026-36229-3

Ключевые слова: прогнозирование качества воды, загрязнение рек, глубокое обучение, пространственно-временное моделирование, экологический мониторинг