Clear Sky Science · tr
İçme suyu arıtma tesislerinde çözünmüş oksijen tahmini için özellik seçimi ve yorumlanabilirlik içeren hibrit çerçeve
İçme suyunda oksijen neden önemlidir
Çözünmüş oksijen—suyun içinde karışık halde bulunan küçük oksijen gazı kabarcıkları—içme suğumuzun berrak, güvenli ve iyi tatlı kalıp kalmayacağını sessizce belirler. Ham suyun içinde çok az oksijen olması, demir ve manganez gibi metalleri açığa çıkarabilir, zararlı mikroorganizmaları teşvik edebilir ve arıtmayı daha zor ve maliyetli hale getirebilir. Bu çalışma, gerçek işletme verilerinin ve modern makine öğrenimi tekniklerinin akıllıca kullanımıyla büyük bir içme suyu tesisinde oksijen seviyelerinin nasıl öngörülebileceğini gösteriyor; bu da işletmecilerin su kalitesini yüksek tutarken zaman, enerji ve laboratuvar masraflarından tasarruf etmesine yardımcı olur.
Su arıtmasına hayat vermek
Birçok rezervuar ve nehirde oksijen seviyeleri mevsimlere, kirliliğe ve su hareketine bağlı olarak yükselip düşer. Su durağanlaştığında veya besinlerle aşırı yüklendiğinde oksijen azalabilir; bu da çökeltilerden istenmeyen maddelerin açığa çıkmasına ve sorunlu mikroorganizmaların çoğalmasına yol açar. İçme suyu arıtma tesislerinde sağlıklı oksijen seviyelerini korumak, biyolojik filtreler için ve metaller ile uzaklaştırılması zor bileşiklerin serbest kalmasını önlemek açısından özellikle önemlidir. Ancak geçmiş çalışmaların çoğu nehirler veya atıksu tesislerine odaklanmış; koagülasyon, filtrasyon ve klorlamanın oksijen davranışını benzersiz biçimde değiştirdiği işlenmiş içme suyu sistemleri konusunda bilgi boşlukları bırakmıştır.
Nehirden musluğa on yıllık veri
Araştırmacılar, İran’ın Ahvaz kentindeki tam ölçekli bir su arıtma tesisinden, yaklaşık 450.000 kişinin su ihtiyacını Karun Nehri’nden karşılayan tesisten elde edilen on yıllık günlük kayıtlara başvurdu. Filtrelenmiş giriş suyunun yedi rutin ölçülen özelliğini—geçmiş çözünmüş oksijen, nitrit, klorür, elektriksel iletkenlik, bulanıklık, pH ve sıcaklık—tesis çıkış havuzundaki oksijen seviyesini tahmin etmek için kullandılar. Verileri dikkatle kontrol ettikten, aykırı değerleri ele aldıktan ve ölçümleri standartlaştırdıktan sonra iki popüler ağaç tabanlı makine öğrenimi modeli olan Random Forest ve XGBoost eğitildi. Bu modeller, birçok karar ağacı oluşturarak ve sonuçlarını birleştirerek kalıpları öğrenir; böylece el yapımı denklemlere gerek duymadan karmaşık, doğrusal olmayan ilişkileri yakalayabilirler. 
En önemli sinyalleri bulmak
Temel zorluk, yedi giriş ölçümünden hangilerinin gerçekten oksijen davranışını yönlendirdiğini ve hangilerinin gürültü ya da gereksiz karmaşıklık kattığını belirlemekti. Tek bir sıralama yöntemine güvenmek yerine ekip, veriyi birkaç açıdan inceleyen bir “hibrit” seçim hattı oluşturdu. Mutual Information en güçlü şekilde oksijenle ilişkilendirilen değişkenleri öne çıkarırken, Mean Decrease in Impurity ağaçların içinde hangi ölçümlerin en kullanışlı olduğunu yakaladı ve Permutation Importance bir değişkenin değerleri karıştırıldığında tahminlerin ne kadar kötüleştiğini test etti. Bunların üzerine SHAP yöntemi, her özelliğin tahmini yukarı veya aşağı nasıl ittiğini örnek bazında açıkladı ve hem genel hem de vaka özelinde içgörü sağladı. Bu dört teknik arasında üç girdi açıkça öne çıktı: önceki günün oksijen seviyesi, su sıcaklığı ve bulanıklık. pH ve nitrit gibi ölçümler bilimsel olarak ilginç olsa da, bu tesiste tahminleri iyileştirmeye çok az katkıda bulundu.
Daha yalın modellerle doğru tahminler
En bilgilendirici girdilere odaklanıp en az yararlı olanları çıkartarak araştırmacılar model karmaşıklığını yüzde 70’e kadar azaltırken doğruluğu neredeyse hiç değiştirmediler. Hem Random Forest hem de XGBoost, ölçülen çıkış oksijen seviyelerini yüksek doğrulukla yeniden üretti; varyasyonun yüzde 93’ünden fazlasını açıkladılar ve tipik hataları 0.3 miligram/litrenin altında tuttular—günlük işletme için yararlı aralık içinde. XGBoost genel olarak biraz daha iyi performans gösterse de, her iki model de giriş seti azaltıldığında bile dayanıklıydı. Bu verimlilik pratikte önem taşıyor: daha az ölçüm gerekliliği daha düşük izleme maliyetleri ve tesis kontrol sistemlerine entegre edilebilecek daha hızlı, daha güvenilir tahminler anlamına geliyor. 
Güvenli, verimli içme suyu için ne anlama geliyor
Uzman olmayanlar için sonuç açık: farklı veri odaklı yöntemlerin hangi ölçümlerin en önemli olduğuna “oy vermesine” izin verildiğinde, işletmeciler gerçek zamanlı olarak çözünmüş oksijeni güvenilir şekilde tahmin eden kompakt ve şeffaf araçlar kurabilirler. Oksijenin ne zaman düşebileceğini önceden bilmek, bir tesise havalandırmayı ince ayarlama, filtreleri koruma ve metalleri açığa çıkaran veya zararlı mikropları destekleyen koşullardan kaçınma imkanı verir—aynı zamanda enerji ve kimyasalların aşırı kullanımından da kaçınılmış olur. Bu tek tesis ve parametrenin ötesinde, aynı hibrit yaklaşım kirleticilerin izlenmesinden alg patlamalarının öngörülmesine kadar diğer çevresel sorulara da uygulanabilir; su kalitesi ile kamu sağlığının kesiştiği alanlarda daha net ve daha güvenilir yönlendirme sunar.
Atıf: Hoshyarzadeh, R., Hafshejani, L.D., Tishehzan, P. et al. A hybrid framework of feature selection and interpretability for dissolved oxygen prediction in drinking water treatment plants. Sci Rep 16, 6912 (2026). https://doi.org/10.1038/s41598-026-37276-6
Anahtar kelimeler: çözünmüş oksijen, içme suyu arıtımı, makine öğrenimi, özellik seçimi, su kalitesi izleme