Clear Sky Science · ru

Прогноз индекса качества воды с помощью надежной модели машинного обучения на основе показателей, связанных с кислородом, для мониторинга качества речной воды

· Назад к списку

Почему кислород в реках важен для всех

Чистые реки — это не просто живописный фон; они служат источниками питьевой воды, орошения и местом обитания рыб и дикой природы. Тем не менее многие реки в мире постепенно задыхаются, когда загрязнение лишает воду кислорода. В этом исследовании предложен новый, более совершенный способ наблюдения за состоянием рек: с помощью нескольких показателей, связанных с кислородом, и машинного обучения предсказывается понятный индекс качества воды. Цель — дать сообществам и принимающим решения органам быстрый и надёжный инструмент для обнаружения проблем до того, как реки перейдут в кризисное состояние.

Figure 1
Figure 1.

Простой балл для сложной реки

Водные специалисты нередко сводят десятки химических и биологических измерений в единый индекс качества воды (WQI). Этот индекс позволяет неспециалистам мгновенно оценить, является ли вода отличной, хорошей, средней или плохой. Однако во многих версиях WQI кислород либо учтён косвенно, либо недостаточно использован, несмотря на его ключевую роль для водных экосистем. Кислород показывает, могут ли рыбы дышать, разлагаются ли отходы микробами и способна ли река восстановиться после загрязнения. Авторы утверждают, что более умный индекс должен опираться в первую очередь на кислородные показатели, которые широко измеряются и напрямую связаны с выживанием речных экосистем.

Наблюдения за тремя очень разными реками

Для проверки идеи исследователи сосредоточились на трёх контрастных реках в Иране. Одна протекает через тёплый полузасушливый бассейн с большими колебаниями температуры; другая — холодная и быстрая, стекающая с гористых районов у Каспийского моря; третья впадает в экологически напряжённое озеро Урмия. Вместе они охватывают участки с чистой, хорошо насыщенной кислородом водой, а также более мутные, напряжённые участки, на которые влияют сельское хозяйство, города и промышленность. На десятках станций вдоль этих рек команды измеряли базовые полевые параметры — температуру, растворённый кислород, кислотность и электропроводность — и брали пробы для лабораторного анализа на органическое загрязнение, взвешенные наносы, питательные вещества и бактерии.

Обучение «супермодели» читать воду

Из этого богатого набора данных авторы построили так называемую «Супермодель», применив метод машинного обучения, известный как регрессия опорных векторов (Support Vector Regression). Вместо того чтобы загружать алгоритм всеми доступными химическими показателями, они сосредоточились на небольшом наборе индикаторов, связанных с кислородом: растворённый кислород, биохимическая потребность в кислороде (BOD), химическая потребность в кислороде (COD) и температура воды. Эти измерения отражают, сколько кислорода в воде, насколько быстро он потребляется органическим и химическим загрязнением и как температура ускоряет или замедляет эти процессы. Модель была обучена предсказывать новый кислородно-ориентированный индекс качества воды WQIOIs, который повторяет традиционные оценки WQI, но в первую очередь опирается на эти ключевые кислородные сигналы.

Проверка точности, универсальности и объяснимости

Команда задала три ключевых вопроса: насколько точна модель, насколько она универсальна и можно ли понять её решения? Во-первых, показано, что модель предсказывает WQIOIs чрезвычайно хорошо, объясняя более 95% вариации и демонстрируя очень небольшие средние ошибки. Во-вторых, при испытаниях на реках, «незнакомых» модели в период обучения, она по-прежнему тесно совпадала с более сложным традиционным индексом, использующим множество дополнительных измерений. Это свидетельствует о том, что несколько тщательно подобранных кислородных показателей могут заменить полное лабораторное исследование. В-третьих, авторы применили метод интерпретируемости SHAP, чтобы заглянуть внутрь логики модели. Анализ подтвердил, что высокий растворённый кислород значительно повышает оценку качества, тогда как высокая температура и сильное органическое загрязнение снижают её, что соответствует хорошо установленным экологическим представлениям, а не скрытым артефактам данных.

Figure 2
Figure 2.

От чисел к предупреждениям в реальном времени

Помимо технических испытаний, исследование рассматривает, как этот инструмент мог бы работать на практике. Кластеризуя состояния реки в категории, такие как «Холодная и здорова» или «Тёплая и истощённая по кислороду», менеджеры могут видеть, когда река переходит в рискованное состояние, например летом при малых расходах, когда тёплая вода удерживает меньше кислорода. Модель также ранжирует образцы так, что небольшое число замеров может выявить большинство действительно пострадавших участков — это важно при ограниченных бюджетах и штате. Поскольку требуемые измерения недорогие и широко доступны, та же схема может быть интегрирована в простые панели мониторинга или системы раннего предупреждения во многих регионах, включая те, где лабораторных возможностей мало.

Что это значит для рек и людей

Проще говоря, исследование показывает, что состояние реки можно очень точно судить, наблюдая за её «дыханием». Компактный набор кислородно-ориентированных тестов в сочетании с тщательно обученной моделью машинного обучения может сопоставляться по эффективности с гораздо более сложными и дорогими схемами мониторинга. Это означает более быстрое и доступное отслеживание загрязнений, улучшенное планирование инспекций и мероприятий по очистке, а также более ясную коммуникацию с общественностью о том, когда река безопасна для рыбы, сельского хозяйства или отдыха. По мере того как аналогичные модели будут распространяться и адаптироваться к другим регионам, они могут стать основой для защиты рек в режиме реального времени на основе данных по всему миру.

Цитирование: Arzhangi, A., Partani, S. Water quality index prediction via a robust machine learning model using oxygen-related indices for river water quality monitoring. Sci Rep 16, 6102 (2026). https://doi.org/10.1038/s41598-026-36156-3

Ключевые слова: качество речной воды, растворённый кислород, индекс качества воды, машинное обучение, экологический мониторинг