Clear Sky Science · ja

浄水場における溶存酸素予測のための特徴選択と解釈性を統合したハイブリッドフレームワーク

· 一覧に戻る

飲料水中の酸素が重要な理由

溶存酸素――水に溶け込んだ小さな酸素の泡――は、飲料水が透明で安全で風味を保つかどうかに静かに影響します。原水中の酸素が不足すると、鉄やマンガンなどの金属が溶出しやすくなり、有害な微生物を助長し、処理が困難かつ高コストになることがあります。本研究は、実際の運転データと最新の機械学習を賢く組み合わせることで、大規模な浄水場の酸素濃度を予測し、運転者が水質を高く維持しつつ時間・エネルギー・検査費用を節約できることを示します。

水処理に息吹を与える

多くの貯水池や河川では、酸素濃度は季節、汚染、流動によって上下します。水が停滞したり栄養塩で過負荷になると酸素が低下し、堆積物から望ましくない物質が放出されたり、問題を起こす微生物に有利な条件が生じます。浄水場では、生物ろ過の維持や、除去が難しい金属や化合物の遊出防止のために、健全な酸素レベルを保つことが特に重要です。しかし、これまでの研究の多くは河川や下水処理を対象としており、凝集、ろ過、塩素処理などの工程が酸素挙動に独特の影響を与える浄水処理システムには知見の空白が残っています。

河川から蛇口までの10年分のデータ

研究者らは、イラン・アフワーズの実規模浄水場の10年分の日次記録を活用しました。この浄水場はカルーン川の水を約45万人分処理しています。彼らは、ろ過後流入水の通常測定される7つの指標――過去の溶存酸素、亜硝酸塩、塩化物、電気伝導率、濁度、pH、温度――を用いて、浄水場の出口槽の酸素レベルを予測しました。データの入念な点検、外れ値処理、測定値の標準化を行った後、ランダムフォレストとXGBoostという二つの代表的なツリーベース機械学習モデルを訓練しました。これらのモデルは多数の決定木を構築してその結果を統合することで、手作業の数式を必要とせずに複雑で非線形な関係を捉えられます。

Figure 1
Figure 1.

重要な信号の検出

主要な課題は、7つの入力測定値のうちどれが実際に酸素挙動を駆動し、どれがノイズや不必要な複雑さを加えているかを見極めることでした。単一のランキング手法を鵜呑みにする代わりに、チームはデータを複数の角度から評価する「ハイブリッド」選択パイプラインを構築しました。相互情報量(Mutual Information)は酸素と強く結びつく変数を浮き彫りにし、不純物減少平均(Mean Decrease in Impurity)は木の内部で有用な測定を示し、Permutation Importanceは変数の値をシャッフルしたときに予測がどれだけ悪化するかを検証しました。さらにSHAP法は、個々の事例ごとに各特徴が予測を上げるか下げるかを説明し、全体的かつ事例特有の洞察を提供しました。これら4つの手法を通じて、前日の酸素レベル、水温、濁度の3つの入力が明確に重要であることが示されました。pHや亜硝酸塩のような指標は科学的には興味深いものの、この浄水場では予測精度の向上にほとんど寄与しませんでした。

簡素化したモデルで高精度を達成

最も情報量の多い入力に絞り、寄与の小さいものを除くことで、研究者らはモデルの複雑さを最大70%削減しつつ、精度をほぼ維持しました。ランダムフォレストとXGBoostの両モデルは、出口の測定された酸素レベルを高精度で再現し、変動の93%以上を説明し、典型的な誤差を0.3 mg/L未満に抑えました。これは日常の運転で有用な範囲内です。全体的にはXGBoostがわずかに良好な成績を示しましたが、入力セットを削減しても両モデルとも頑健でした。この効率性は実務で重要です:必要な測定が少ないほどモニタリングコストが下がり、より迅速で信頼性の高い予測が得られ、浄水場の制御システムに統合しやすくなります。

Figure 2
Figure 2.

安全で効率的な飲料水への示唆

専門外の方にも結論は明快です:データ駆動の複数手法に「投票」させて重要な測定を選ぶことで、運転者はコンパクトで透明性のある予測ツールを構築し、溶存酸素をリアルタイムで確実に予測できます。酸素が低下しそうな時期を事前に把握できれば、曝気の調整、ろ過装置の保護、金属の遊出や有害微生物の増殖を避けるための対策を講じられ、過剰なエネルギーや薬剤の使用も回避できます。この単一の浄水場とパラメータを超えても、同じハイブリッド手法は汚染物質の追跡や藻類発生の予測など、他の環境課題にも適用でき、水質と公衆衛生が交差する領域でより明確で信頼できる指針を提供します。

引用: Hoshyarzadeh, R., Hafshejani, L.D., Tishehzan, P. et al. A hybrid framework of feature selection and interpretability for dissolved oxygen prediction in drinking water treatment plants. Sci Rep 16, 6912 (2026). https://doi.org/10.1038/s41598-026-37276-6

キーワード: 溶存酸素, 飲料水処理, 機械学習, 特徴選択, 水質モニタリング