Clear Sky Science · tr

Hafif çok başlı derinlik ayrılmalı evrişim ağıyla COVID-19 tahminlerini geliştirmek

· Dizine geri dön

Daha iyi salgın tahminleri neden hâlâ önemli

COVID-19 pandemisi, bir salgının farklı yerlerde ne zaman yükseleceğini veya düşeceğini tahmin etmenin ne kadar zor olduğunu gösterdi. Hükümetler ve hastaneler, yatak eklemek, aşı sipariş etmek veya halk sağlığı önlemlerini sıkılaştırmak gibi kararlar almak için bu tahminlere güvenir. Ancak gerçek dünya verileri dağınık ve özellikle salgının erken dönemlerinde çoğunlukla sınırlıdır. Bu makale, yalnızca küçük ve gürültülü veri kümeleri olduğunda bile kısa vadeli COVID-19 tahminlerini daha doğru ve daha verimli hale getirmeyi amaçlayan yeni bir bilgisayar modelini tanıtıyor.

Salgın eğrilerini okumaya taze bir bakış

Erken dönem COVID-19 tahminlerinin çoğu, nüfusu duyarlı ve enfekte gibi gruplara ayıran klasik matematiksel formüllere veya geçmiş eğilimleri geleceğe uzatan basit istatistiksel araçlara dayanıyordu. Daha yakın zamanda, derin öğrenme yöntemleri araç setine katıldı çünkü bu yöntemler eski yaklaşımların kaçırdığı verideki karmaşık şekilleri yakalayabiliyor. Bunlar arasında, evrişimsel ağlar ve yinelemeli ağların birleşimleri özellikle başarılı oldu. Ancak bu karma modeller ağır, yavaş ve veri noktası az olduğunda (yerel salgınlarda veya daha küçük ülkelerde sık rastlanan bir durum) aşırı uyuma eğilimli olabiliyor.

Figure 1. Nasıl kompakt üç yollu bir modelin dağınık ülke vaka eğrilerini daha düzgün COVID-19 tahminlerine dönüştürdüğü.
Figure 1. Nasıl kompakt üç yollu bir modelin dağınık ülke vaka eğrilerini daha düzgün COVID-19 tahminlerine dönüştürdüğü.

İnce veriler için tasarlanmış hafif bir model

Yazarlar, modern derin öğrenmede işe yarayan öğeleri korurken gereksiz karmaşıklığı budamaya çalışan CDSCnet adlı yeni bir model öneriyor. Bir yinelemeli ağ gibi zaman boyunca tekrar tekrar döngüye girmek yerine, CDSCnet zaman ekseni boyunca kayan hızlı filtrelerden oluşan bir diziye dayanıyor. Her giriş dizisini üç örtüşen parçaya ayırıyor, her parçayı kendi yolunda işliyor ve sonra tekrar bir araya getiriyor. Bu yollarda, derinlik ayrılmalı evrişim (depthwise separable convolution) adı verilen özel bir filtre türü, hesaplamayı bilgiyi verimli şekilde yeniden kullanan küçük parçalara ayırıyor. Son veri noktasını sıfırla doldurmak yerine kopyalamak ve nazik ortalamalar kullanmak gibi ek hileler, modelin eğrinin en bilgilendirici kısımlarına odaklanmasına ve boyutunun kontrolden çıkmamasına yardımcı oluyor.

Yeni yaklaşımı teste sokmak

Bu tasarımın işe yarayıp yaramadığını görmek için araştırmacılar CDSCnet'i, yaygın olarak kullanılan CNN–LSTM yaklaşımının birkaç versiyonu dahil olmak üzere çeşitli rakip modellerle karşılaştırdı. Farklı kıtalardan yedi ülkenin resmi COVID-19 vaka ve ölüm sayılarını kullandılar; hem daha düzgün zaman serileri hem de çok gürültülü olanlar dahil edildi. On bir farklı tahmin görevinde CDSCnet genellikle en küçük hataları üretti; bazen, İspanya örneğinde olduğu gibi, yeniden üretilen en iyi CNN–LSTM sonuçlarına kıyasla tipik hataları yarıya kadar düşürdü. Model, İsviçre ve Hırvatistan gibi günlük verilerin oldukça düzensiz olduğu durumlarda bile rekabetçi kaldı ve yazarların bu kırıklı kayıtları basit bir haftalık ortalama ile düzleştirmesi halinde avantajı arttı.

Figure 2. Tek bir vaka eğrisini üç filtrelenmiş yola bölüp yeniden birleştirmenin nasıl daha temiz bir tahmin sinyali verdiği.
Figure 2. Tek bir vaka eğrisini üç filtrelenmiş yola bölüp yeniden birleştirmenin nasıl daha temiz bir tahmin sinyali verdiği.

Hız, basitlik ve sayılar ne diyor

Doğruluğun ötesinde ekip, her modelin kaç ayarlanabilir düğüme (parametre) ihtiyaç duyduğunu ve ne kadar hesaplama tükettiğini inceledi. CDSCnet, onlarca kat daha fazla parametre kullanan derin bir CNN–LSTM de dahil olmak üzere birkaç popüler kıyas modeline göre çok daha az parametre gerektirdi. Bu kompakt ayak izine rağmen CDSCnet doğrulukta diğerleriyle eşleşti veya onları aştı. Daha yakından bakıldığında, standart filtrelerin yerine derinlik ayrılmalı filtrelerin kullanılmasının modeli küçültmede kilit olduğu ve üç yollu yapıyı her katmanda genişletmek yerine sabit tutmanın hem bellek kullanımı hem de çalışma süresi açısından dengeyi korumaya yardımcı olduğu görüldü.

Gelecek salgınlar için anlamı

Düz bir ifadeyle, bu çalışma hem doğru hem de veri ile hesaplama gücü bakımından tutumlu COVID-19 tahmin araçları oluşturmanın mümkün olduğunu öne sürüyor. CDSCnet geçmiş vaka eğrilerini okuyor, kısa ve daha uzun vadeli desenleri ayıklıyor ve bunları nispeten küçük ve şeffaf bir tasarım kullanarak daha güvenilir kısa vadeli tahminlere dönüştürüyor. Yazarlar, aşılar, politikalar veya hareketlilik desenleri hakkında bilgi eklemenin ve daha uzun vadeli tahminleri araştırmanın önemli bir sonraki adım olacağını belirtiyor. Yine de sonuçları, veri sınırlı, gürültülü ve acilen gerektiği durumlarda, CDSCnet gibi dikkatle ayarlanmış hafif modellerin pratik karar destek sunabileceğini gösteriyor.

Atıf: Lan, H., Ni, S. Enhancing COVID-19 forecasts with a lightweight multi-head depthwise separable convolution network. Sci Rep 16, 15825 (2026). https://doi.org/10.1038/s41598-026-46170-0

Anahtar kelimeler: COVID-19 tahminleri, salgın modelleme, derin öğrenme, zaman serisi tahmini, hafif sinir ağı