Clear Sky Science · tr
Birleşik Krallık COVID-19 salgın verileriyle güçlendirme öğrenmesi kullanılarak bulaşıcı hastalık müdahale önlemlerinin optimizasyonu
Zor Sağlık Kararları İçin Akıllı Araçlar
Yeni bir hastalık bir ülkeyi hızla sarmaya başladığında, liderler günlük yaşamı ne kadar kısıtlayacaklarına çabuk karar vermek zorundadır. Her şeyi kapatırsanız hayat kurtarabilirsiniz ama ekonomiyi mahvedersiniz; çok yavaş hareket ederseniz hastaneler dolup taşar. Bu makale, güçlendirme öğrenmesi adı verilen bir yapay zeka biçiminin, COVID‑19 benzeri bir virüsün gerçek topluluklarda nasıl yayıldığını ayrıntılı simülasyonlarla modelleyerek hükümetlere daha akıllı, dengeli tepkiler bulmada yardımcı olup olamayacağını araştırıyor.
Bir Ülküyü Bilgisayarda Simüle Etmek
İnsanları birbirinin aynısı gibi ele alan basit denklemler kullanmak yerine yazarlar, binlerce sanal bireyin yaşadığı, çalıştığı, öğrendiği ve etkileşim kurduğu ayrıntılı bir bilgisayar modeli olan Covasim üzerine kuruyorlar. Her simüle edilmiş kişinin yaşı, ailedeki yeri, okul ve işyeri ağlarındaki konumu ile sağlığı; sağlıklı, enfekte, iyileşmiş veya ölü gibi durumlara dönüşebilen bir sağlık durumu vardır. Modelin ayarlarını dikkatle ayarlayarak ekip, bu sanal Birleşik Krallık’ın COVID‑19’un ilk dalgasında gerçek Birleşik Krallık gibi davranmasını sağlıyor; 2020 başlarındaki resmi vaka ve ölüm sayılarına uyum sağlıyor. Bu kalibrasyon adımı çok önemli çünkü bilgisayarın öğrendiği herhangi bir stratejinin oyuncak bir evren değil, bizimkine benzeyen bir dünyada işe yaraması gerekir.

Bir Dijital Danışmanı Hareket Etmeyi Öğretmek
Model gerçeğe benzer davranmaya başladıktan sonra araştırmacılar güçlendirme öğrenmeyi devreye sokuyor; burada yazılım bir “ajan” kararları tekrar tekrar dener ve sonuçlara göre ödüllendirilir veya cezalandırılır. Bu çalışmada ajan her simüle haftada üç ana kontrol düğmesini ayarlayabiliyor: kısmi kilitlenmelerin ne kadar sıkı olduğu, kaç kişinin test edildiği ve temas takibinin ne kadar agresif kullanıldığı. Ödül sistemi iki rekabet eden hedefi yakalamak üzere tasarlanmış: enfeksiyonları, ağır hastalıkları ve ölümleri düşük tutmak ile işyerlerini kapatmanın ve insanları tecrit etmenin ekonomi üzerindeki zararını sınırlamak. Binlerce simüle salgın çalıştırılarak ajan hangi önlemlerin ve zamanlamaların en yüksek toplam puanı getirdiğini keşfediyor.
Sabit Kurallardan Daha İyi Denge Bulmak
Araştırma, birkaç öğrenme yöntemini ve ajanın seçimlerini tarif etme yollarını karşılaştırıyor. Eylemleri küçük bir sabit seçenek menüsü yerine pürüzsüz düğme ayarları olarak ele alan bir yöntem özellikle iyi performans gösteriyor. Virüs yayılmaya başladığında hızlı tepki verip kısa ama güçlü kısıtlamalar uygulamayı ve bunları yoğun test ve temas takibi ile eşleştirmeyi öğreniyor. Simüle salgın kontrol altına alındıkça kilitlenmeleri gevşetiyor, bazı test ve temas takibini sürdürürken enfeksiyonlar yeniden artma tehdidi oluşturursa kısa süreliğine tekrar sıkılaştırıyor. Bu esnek düzen modelde toplam enfeksiyon sayısını yaklaşık 300.000 civarında tutuyor; bu, aynı dönemde Birleşik Krallık’ta uygulanan gerçek dünya politikalarının yol açtığından ve basit bir “yedi gün açık, yedi gün kapalı” kuralından çok daha düşük. Modeldeki ekonomik kayıplar, bu katı dönüşümlü kilitlenme stratejisine kıyasla iki üçte ikiden fazla azaltılıyor.

Zamanlama Gerçekten Önemli
Yazarlar ayrıca bu farklı stratejilerin gerçek zamanlı üreme sayısını—her vakanın ürettiği yeni enfeksiyon sayısının bir ölçüsü—nasıl etkilediğini inceliyor. Simülasyonlarında yapay zeka tarafından tasarlanan politika, bu sayıyı Birleşik Krallık’ın gerçek yanıtından yaklaşık bir ay daha erken kritik değer olan birin altına düşürüyor. Görünüşte küçük olan bu kayma kümülatif enfeksiyonları dramatik biçimde azaltıyor; bu da erken ve iyi planlanmış eylemin ne kadar fark yaratabileceğini vurguluyor. Ayrıca öğrenilen politikayı 2022’de Hong Kong’daki büyük COVID‑19 dalgasının verileriyle çok farklı bir ortamda test ediyorlar ve aynı stratejinin hâlâ iyi performans gösterdiğini buluyorlar; bu da öğrenilen kuralların tek bir ülkeye aşırı uyum sağlamak yerine genel ilkeleri yakaladığını düşündürüyor.
Gelecek Salgınlar İçin Ne Anlama Geliyor
Uzman olmayanlar için ana mesaj, hayat kurtarmak ile geçim kaynaklarını korumak arasında körü körüne bir tercih yapmak zorunda olmadığımızdır. Bir virüsün gerçek sosyal ağlarda nasıl hareket ettiğinin ayrıntılı simülasyonlarını insan karar verme süreçleriyle birleştirerek deneme‑yanılma yoluyla öğrenen yapay zeka, politika yapıcılara koşullar değiştikçe uyum sağlayan veri odaklı oyun planları sunabilir. Yazarlar, bu tür araçların insan yargısını yerine koymak için değil, insanlara sayısız ne‑olursa‑olurdu senaryosunu insanlardan çok daha hızlı keşfetme imkânı sağlayan güçlü karar destekçileri olarak hizmet etmesi gerektiğini vurguluyor. Yeni salgınlar ortaya çıktığında bu yaklaşım, liderlerin hastalığı kontrol altında tutarken mümkün olduğunca normal yaşamı ve ekonomik faaliyeti koruyacak şekilde hedeflenmiş test, temas takibi ve kısmi kapanmalarla daha erken ve daha isabetli hareket etmelerine yardımcı olabilir.
Atıf: Zhang, B., Chen, Y., Li, H. et al. Optimization of infectious disease intervention measures using reinforcement learning with UK COVID-19 epidemic data. Sci Rep 16, 10627 (2026). https://doi.org/10.1038/s41598-026-39377-8
Anahtar kelimeler: COVID-19 politikası, güçlendirme öğrenmesi, salgın simülasyonu, farmasötik olmayan müdahaleler, kamu sağlığı stratejisi