Clear Sky Science · ru
Парадигмы обобщения моделей для предсказания вирусных частиц и оценки эффективности удаления в анаэробных мембранных биореакторах
Почему чище переработанная вода важна
По мере того как города ищут новые источники воды в условиях потепления и роста населения, переработанные сточные воды всё чаще становятся частью обычной водопроводной сети. Но даже после продвинутой очистки мелкие вирусы могут пройти через барьеры, вызывая опасения за здоровье и безопасность. В этом исследовании рассматривается, как искусственный интеллект может выступать в роли бдительного «мягкого датчика» — тихо отслеживая работу очистных сооружений в реальном времени, сигнализируя об изменениях в вирусном загрязнении и подтверждая, что повторно используемая вода остаётся безопасной.

Понимание изменчивой цели
Очистные сооружения для сточных вод — это вовсе не статичные системы. Состав бытовых и промышленных стоков меняется по часам, а эффективность фильтров и мембран со временем может дрейфовать. Традиционные лабораторные методы измерения вирусов в воде медленные и трудоёмкие: образцы нужно собрать, доставить и проанализировать, часто спустя дни после того, как вода уже была сброшена или повторно использована. Такая задержка затрудняет быстрые действия операторов при росте уровня вирусов. Авторы сосредоточились на анаэробных мембранных биореакторах — системах, которые очищают сточные воды с помощью микроорганизмов и мелкопористых мембран, одновременно генерируя энергию. Эти установки способны удалять многие патогены, но мониторинг их эффективности в каждый момент времени остаётся серьёзной задачей.
Обучение компьютеров обнаруживать вирусы
Вместо постоянного прямого измерения вирусов команда обучила модели машинного обучения выводить уровни вирусного загрязнения по простым, легко доступным показателям качества воды, таким как pH, мутность, содержание солей и уровень питательных веществ. Работали с двумя анаэробными мембранными установками в разных городах Саудовской Аравии: пилотной муниципальной установкой при университете и более крупным смешанным муниципально-промышленным объектом. Чтобы преодолеть проблему небольшого числа реальных образцов, проанализированных на вирусы, исследователи использовали три «генератора» данных для создания реалистичных синтетических наборов данных, имитирующих поведение реальных установок. Эти расширенные наборы данных подпитывали две продвинутые стратегии обучения: модель «пожизненного» обучения, которая непрерывно адаптируется по мере поступления новых данных, и модель с механизмом внимания, которая учится фокусироваться на наиболее информативных сигналах и временных точках при прогнозировании концентраций вирусов.
Отслеживание вирусов в ходе очистки
Моделям было предложено предсказывать наличие нескольких важных вирусных мишеней, включая аденовирусы человека и распространённые вирусные маркеры фекального загрязнения, на разных этапах очистки. Затем вычисляли логарифмическое значение удаления (log removal value) — стандартный способ выразить, во сколько раз снижаются уровни вирусов между исходными сточными водами и обработанным сбросом. По данным обеих установок и на различных стадиях обработки виртуальные мягкие датчики в целом хорошо соответствовали лабораторным измерениям, зачастую объясняя более 90 % вариации уровней вирусов. Системы правильно зафиксировали сильное удаление аденовируса и перчинного лёгочного мозаичного вируса (pepper mild mottle virus), а также более умеренное снижение общего числа вирусов. Важно, что они оставались точными даже при применении к данным из другой установки, чем та, на которой их обучали, или при прогнозировании эффективности на другом этапе обработки.

Адаптация к новым установкам и меняющимся условиям
Ключевым достижением этой работы стала устойчивость. Сточные воды с университетского кампуса и из промышленной зоны выглядят очень по-разному, но те же модели можно было переносить между ними с лишь незначительной корректировкой. Подход пожизненного обучения показал себя лучше всего при постоянном обновлении по мере поступления новых пакетов данных, без необходимости полного повторного обучения. Подход на базе внимания, в свою очередь, выделял, какие сигналы качества воды и какие временные окна наиболее важны для надёжного прогноза и мог быть повторно использован на совершенно новых наборах данных. Обе стратегии справлялись с естественным «дрейфом» в поведении установки со временем, что даёт основания полагать, что они смогут поддерживать актуальность при изменении условий эксплуатации, состава поступающих стоков или даже климатических паттернов.
Что это значит для более безопасного повторного использования воды
Для неспециалистов итог таков: это исследование приближает нас к практическому мониторингу вирусов в реальном времени на продвинутых очистных сооружениях без необходимости постоянных дорогостоящих лабораторных тестов. Изучая легко измеримые сигналы качества воды, эти умные мягкие датчики могут с высокой точностью оценивать уровни вирусов и эффективность их удаления, предупреждать операторов о снижении эффективности и помогать регуляторам подтверждать соответствие повторно используемой воды требованиям безопасности. По мере того как такие инструменты будут дорабатываться и расширяться на большее число загрязнителей и типов установок, они могут стать краеугольным камнем безопасного и устойчивого повторного использования воды в регионах с её дефицитом по всему миру.
Цитирование: Chen, J., N’Doye, I., Sanchez Medina, J. et al. Model generalization paradigms for predicting viral particles and evaluating removal efficiencies in anaerobic membrane bioreactor plants. npj Emerg. Contam. 2, 10 (2026). https://doi.org/10.1038/s44454-026-00030-8
Ключевые слова: повторное использование сточных вод, мониторинг вирусов, машинное обучение, мембранные биореакторы, качество воды