Clear Sky Science · tr

Hava kalitesi endeksi tahmini için topluluk öğrenmesi: SHAP tabanlı yorumlanabilirlik ile gradyan artırma, XGBoost ve istiflemeyi bütünleştirme

2026-02-12 · Dizine geri dön

Neden Daha Temiz Hava Daha Akıllı Tahminler Gerektirir

Hava kirliliği, işe giderken soluduğumuz havadan çocuklarımızın ve yaşlılarımızın sağlığına kadar günlük yaşantımızı sessizce biçimlendirir. Yine de çoğumuz bir telefon uygulamasında yalnızca tek bir hava kalitesi numarası görür; bunun nasıl hesaplandığını veya ne kadar güvenilir olduğunu bilmeyiz. Bu makale, işbirliği yapan bilgisayar modelleri takımı kullanarak Hava Kalitesi Endeksi (AQI) için daha akıllı bir tahmin yöntemi araştırıyor. Bu tahminleri hem daha doğru hem de daha şeffaf hâle getirerek çalışma, zamanında sağlık uyarıları, daha iyi şehir planlaması ve günlük hayat için daha bilinçli seçimler yönünde bir yol gösteriyor.

Kirli Havanın İnsanlara ve Şehirlere Etkisi

Çalışma, modern yaşamın hava kirliliğini nasıl beslediğini özetleyerek başlıyor. Hızlı kentleşme, yoğun trafik, hızla artan inşaat faaliyetleri ve fosil yakıtların yakılması atmosfere zararlı maddelerin karışımını salar. Çok küçük parçacıklar (PM2.5 ve PM10) ile ozon, nitrojen oksitler, kükürt dioksit ve karbon monoksit gibi gazlar birlikte akciğerleri zedeler, kalbe yük bindirir ve her yıl milyonlarca erken ölüme bağlıdır. Sağlığın ötesinde, kirli hava ekinlere zarar verir, yapıların aşınmasını hızlandırır, iş gücü verimini düşürür ve iklim değişikliğini kötüleştirir. Bu etkiler geniş kapsamlı ve maliyetli olduğundan şehirlerin insanları önceden uyaracak, trafik ve sanayi denetimlerini yönlendirecek ve uzun vadeli çevre politikalarını destekleyecek güvenilir tahminlere acilen ihtiyacı vardır.

Karmaşık Hava Verilerini Tek Bir Sağlık Sayısına Dönüştürmek

AQI, birçok ölçümü temizden tehlikeliye tek bir ölçeğe yoğunlaştırır. Bu sayıyı tahmin etmek için araştırmacılar Tayvan’dan büyük bir açık veri kümesi kullandılar: 2016 ile 2024 arasındaki döneme ait 74 izleme istasyonundan alınan 4,6 milyondan fazla saatlik kayıt. Her kayıt, temel kirleticilerin düzeylerini, yakın maruziyeti yakalayan kısa dönemli ortalamaları ve rüzgar hızı ile yönü gibi hava koşullarını listeliyor. Ekip öncelikle veriyi temizledi, eksik değerler ve uç değerlerle dikkatle ilgilendi ve hiçbir tek ölçümün diğerlerini gölgelememesi için sayıları standardize etti. Ardından eğitim, ayarlama ve test için ayrı bölümler ayırdılar ve algoritmaların henüz görmediği sonraki yıllarda modellerin performansını kontrol ederek gerçeğe yakın zamanlı bir sınama benzetimi yaptılar.

Sadece Birine Güvenmek Yerine Bir Model Takımı Kurmak

Tek bir tahmin formülüne güvenmek yerine yazarlar "topluluk" bir model inşa ettiler—birkaç güçlü ağaç tabanlı yöntemi birleştiren ağırlıklı bir oy sistemi. Bunlar arasında Gradyan Artırma, XGBoost, LightGBM ve CatBoost bulunuyor; her biri birçok küçük karar ağacı kurarak ve önceki hataları düzelterek desenleri öğreniyor. Topluluk, en güçlü performans gösterenlere ekstra ağırlık veriyor (Gradyan Artırma’ya daha fazla, CatBoost’a biraz daha az vb.), bir panelde en doğru hava tahmincilerine daha çok kulak vermeye benzer şekilde. Titiz arama prosedürleri ve çapraz doğrulama kullanarak yazarlar her bir bireysel modelin ayarlarını dikkatle ayarladılar; böylece birlikte kirleticiler, hava koşulları ve AQI arasındaki ince doğrusal olmayan bağlantıları yakalarken geçmiş veriye fazla uyum sağlamaktan kaçındılar.

Derin Öğrenmeyi Geride Bırakmak ve Kara Kutuya İçeriden Bakmak

Yazarlar bu topluluğu, basit doğrusal regresyon ve temel karar ağaçlarından LSTM, CNN-LSTM ve Transformer ağları gibi modern derin öğrenme sistemlerine kadar geniş bir alternatif yelpazesiyle karşılaştırdılar. Tahmin hatasının ana ölçütlerinde topluluk sürekli olarak en iyi sonucu verdi. Görülmemiş verilerde AQI varyansının %99’undan fazlasını açıkladı ve sonrasında test edildiğinde gelecekteki dönemlerde doğruluk neredeyse kaybolmadı; bu, değişen koşullar altında sağlamlığın bir işareti. "Kara kutuyu" açmak için ekip kısmi bağımlılık grafikleri ve SHAP değerleri gibi yorumlanabilirlik araçlarını kullandı. Bu araçlar hangi girdilerin en önemli olduğunu ve tahmini nasıl etkilediğini ortaya koyuyor. Sonuçlar ince parçacıkları (PM2.5 ve kısa dönem ortalaması), sekiz saatlik ozonu ve PM10 ortalamalarını AQI’nin en etkili belirleyicileri olarak öne çıkarıyor. Ayrıca kükürt dioksitin belirli bir düzeyi aştığında tahmin edilen riskte ani bir artış gibi eşik davranışlarını da ortaya çıkarıyor; bu da sistemin anlamlı ve sağlıkla ilgili desenleri öğrendiğini doğruluyor.

Günlük Yaşam ve Geleceğin Şehirleri İçin Anlamı

Uzman olmayanlar için ana mesaj, hava kalitesi tahminlerinin hem son derece doğru hem de anlaşılır olabileceğidir. Birbirini tamamlayan birkaç modeli birleştirerek ve bu modellerin karar verme süreçlerini aydınlatarak bu çalışma, şehirlerin gerçek zamanlı izleme sistemlerine entegre edebileceği bir tahmin motoru sağlıyor. Böyle bir araç daha erken sağlık uyarıları tetikleyebilir, okul ve açık hava etkinlikleri planlamasını yönlendirebilir veya kirliliğin zirve yapmasının beklendiği günlerde hedefli trafik sınırlamalarını destekleyebilir. Yaklaşım standart kirletici ve hava ölçümlerini kullandığından, başka bölgelere uyarlanabilir, koşullar değiştikçe yeniden eğitilebilir ve tüm kentsel alanları kapsamak için yeni mekânsal yöntemlerle eşleştirilebilir. Kısacası, daha akıllı ve daha şeffaf AQI tahmini, daha sağlıklı ve daha dirençli şehirler için pratik bir yapı taşı olabilir.

Atıf: Singh, S., Kumar, M., Sengar, V. et al. Ensemble learning for air quality index prediction: integrating gradient boosting, XGBoost, and stacking with SHAP-based interpretability. Sci Rep 16, 8544 (2026). https://doi.org/10.1038/s41598-026-39232-w

Anahtar kelimeler: hava kalitesi endeksi, topluluk öğrenmesi, gradyan artırma, kirlilik tahmini, model yorumlanabilirliği