Clear Sky Science · tr
Gerçek dünya ilhamlı senaryolar kullanılarak kritik bakımda eksik zaman serisi verileri için atama stratejilerinin kıyaslanması
YBÜ hastalarında veri boşluklarını doldurmanın önemi
Modern yoğun bakım ünitelerinde her kalp atışı, nefes ve kan basıncı dalgası sürekli bir sayı akışı olarak kaydedilir. Yine de gerçek hayatta bu akışlar deliklerle doludur: sensörler çıkabilir, hastalar taramalar için yataktan ayrılabilir ve cihazlar kısa süreliğine kapatılabilir. Doktorlar ve bilgisayarlar bu eksik kayıtları bir hastanın geleceğini tahmin etmek veya tedaviyi yönlendirmek için kullandığında, bu eksik parçaları nasıl "doldurduğumuz" verilerin anlattığı hikâyeyi ince şekilde değiştirebilir. Bu çalışma pratik bir soruyu, büyük sonuçları olan bir biçimde sorguluyor: basit doğrularla dolumdan en gelişmiş yapay zekâ yöntemlerine kadar geniş bir aralıktaki boşluk doldurma stratejileri arasında, YBÜ'lerde gerçekten meydana gelen veri boşlukları altında hangi yöntemler en iyi sonucu veriyor?

YBÜ hayati bulgularına yakından bakmak
Araştırmacılar, ABD’de bir hastaneden tanımlayıcı bilgileri çıkarılmış yoğun bakım kalışlarını içeren geniş halka açık MIMIC‑IV veri tabanına başvurdular. 26.167 yetişkin yatışı üzerinde yoğunlaştılar ve YBÜ kabulünden sonraki ilk 48 saati incelediler; yatak başında sürekli izlenen dört hayati bulguyu takip ettiler: kalp atış hızı, kan oksijen düzeyi, solunum hızı ve ortalama kan basıncı. Sinyallerin gerçekçiliğini korumak için açıkça imkânsız ölçümler çıkarıldı ve tüm ölçümler saatte bir özetlendi. Bir saatte belirli bir hayati bulgu için kayıt yoksa bu değer eksik sayıldı. Tüm değerlerin yalnızca yaklaşık %4’ü yokken, ekip bu boşlukların rastgele dağılmadığını; genellikle 48 saatlik pencerenin ilerleyen kısımlarında kümelendiğini ve bazen birden fazla hayati bulguyu aynı anda etkilediğini buldu.
Gerçek dünya veri boşluklarının yeniden oluşturulması
Tamamen yapay eksik değer desenleri icat etmek yerine, yazarlar ham verilerde gözlemlediklerinden ve klinisyenlerin yatak başında gördüklerinden esinlenerek üç senaryo kurdular. Birincisinde, zaman zaman kaybolan ölçümleri taklit etmek için bireysel okumalar rastgele silindi. İkincisinde, tüm dört hayati bulgu boyunca 1–3 saatlik bloklar birlikte yok oldu; bu, örneğin hasta monitörlerden uzaktayken yapılan bir taramayı temsil ediyor. Üçüncüsünde ise tek bir hayati bulgu—örneğin kan basıncı—kesintisiz 4 saat boyunca kaldırıldı; bu, bir sensör arızası veya probun yerinden çıkmasıyla uyumludur. Her senaryo tüm verilerin yaklaşık %30’unu kaldırdı ve özgün eğrileri yeniden oluşturmayı amaçlayan herhangi bir yöntem için ciddi bir test sundu.
Eski yöntemler ile modern makine zekâsı
Araştırma ekibi ardından geniş bir yeniden yapılandırma yöntemleri setini karşılaştırdı. Basit başvuru yöntemleri arasında her boşluğu bir hastanın ortalama değeriyle doldurma, son gözlemi ileri taşıma veya en yakın bilinen noktalar arasında düz bir çizgi çizme yer aldı. Daha gelişmiş istatistiksel araçlar eksik değerleri diğer hayati bulgulardan tahmin etmeye çalıştı, fakat bunu yaparken zaman boyutunu düzleştirip her saati tablodaki ayrı bir satır gibi ele almak zorunda kaldılar. Spektrumun diğer ucunda ise zaman ve değişkenler arasındaki desenleri açıkça öğrenen Transformer'lar, yinelemeli ağlar ve üretici modeller gibi derin öğrenme modelleri vardı. Tüm modeller, değerlerin %30’unun rastgele gizlendiği veriler üzerinde eğitildi ve ardından her üç maskeleme senaryosunda sınandı. Performans, yeniden yapılandırmalarının özgün sayılardan ne kadar saptığı ile ölçüldü; dolaşımı yönetmede kritik bir sinyal olan ortalama kan basıncındaki hatalara özel dikkat gösterildi.

Ne işe yaradı, ne zaman ve ne kadar
Genel olarak, en sofistike modeller—özellikle Transformer tabanlı bir yaklaşım ve bir üretici düşman ağı—en düşük ortalama hataları sundu; özellikle boşluklar kısa veya dağınıksa. Ancak mütevazı bir yöntem olan düz çizgi enterpolasyonu da çarpıcı şekilde iyi performans gösterdi ve birçok durumda bu sinir ağlarına yakın sonuçlar verdi. Ölçümlerin sırasını göz ardı eden rastgele ormanlar ve zincirlenmiş denklemler gibi istatistiksel araçlar, karmaşıklıklarına rağmen geride kaldı. Boşlukların şekli de önemliydi. Değerler rastgele eksik olduğunda tüm yöntemler daha iyi görünerek doğrulukları hakkında fazla iyimser bir tablo çizdi. Kayıtta uzun, kesintili delikler—özellikle birkaç saat boyunca veya tek bir sensör arızası halinde—doğru doldurulması çok daha güçtü. Bu daha zorlu ayarlarda en iyi derin öğrenme yöntemleri basit yaklaşımlara göre daha yavaş bozuldu, ancak kazanımlar genellikle gerçek kan basıncı birimlerine çevrildiğinde sınırlı kaldı.
Bulgu yatak başı kararları için neden önemli
Günlük kan basıncı aralıkları için en iyi derin öğrenme modelleri ile basit enterpolasyon arasındaki fark sıklıkla sadece birkaç milimetre civadır—genellikle bir doktorun kararını değiştirmeyecek kadar küçük. Yine de tüm yöntemler, en gelişmiş olanlar bile, kan basıncı çok düşük veya çok yüksek olduğunda—özenli izlemenin en çok önemli olduğu anlarda—zorlandı. Çalışma, YBÜ’de eksik verilerle nasıl başa çıkılacağını seçmenin, hangi algoritmanın seçildiğinden çok boşlukların nasıl ve nerede ortaya çıktığını anlamayla da ilgili olduğunu sonuçluyor. Sofistike modeller özellikle daha uzun veya daha karmaşık boşluklar için artı sağlamaya yatkın olsa da, basit ve şeffaf yöntemler birçok pratik kullanım için fazlasıyla yeterli olabilir. Kritik nokta olarak, daha iyi boşluk doldurma otomatik olarak daha iyi öngörü modelleri anlamına gelmez; gelecekteki çalışmalar, bu yeniden yapılandırma tercihlerinin gerçek klinik kararlara nasıl yansıdığını test etmelidir.
Atıf: Poette, M., Mouysset, S., Ruiz, D. et al. Benchmarking imputation strategies for missing time-series data in critical care using real-world-inspired scenarios. Sci Rep 16, 8116 (2026). https://doi.org/10.1038/s41598-026-39035-z
Anahtar kelimeler: YBÜ zaman serileri, eksik veri, atama yöntemleri, derin öğrenme, hayati bulgular