Clear Sky Science · pl

Porównanie strategii imputacji brakujących danych szeregów czasowych w intensywnej opiece przy scenariuszach inspirowanych rzeczywistością

2026-02-10 · Powrót do spisu

Dlaczego uzupełnianie luk danych ma znaczenie dla pacjentów OIT

W nowoczesnych oddziałach intensywnej terapii każde uderzenie serca, oddech i puls ciśnienia krwi są rejestrowane jako ciągły strumień liczb. Jednak w rzeczywistości te strumienie pełne są luk: czujniki odklejają się, pacjenci wychodzą z łóżka na badania, a urządzenia bywają chwilowo wyłączane. Gdy lekarze i systemy komputerowe korzystają z tych niepełnych zapisów do prognozowania stanu pacjenta lub podejmowania decyzji terapeutycznych, sposób, w jaki „uzupełniamy” brakujące fragmenty, może subtelnie zmienić historię, którą opowiadają dane. Niniejsze badanie stawia praktyczne pytanie o dalekosiężnych konsekwencjach: spośród szerokiego spektrum strategii wypełniania luk — od prostych linii prostych po najnowocześniejszą sztuczną inteligencję — które sprawdzają się najlepiej w warunkach luk występujących rzeczywiście na OIT?

Bliższe spojrzenie na parametry życiowe na OIT

Naukowcy wykorzystali MIMIC-IV, dużą publiczną bazę zanonimizowanych pobytów na OIT z amerykańskiego szpitala. Skoncentrowali się na 26 167 pobytach dorosłych i przeanalizowali pierwsze 48 godzin po przyjęciu na oddział, śledząc cztery parametry życiowe monitorowane ciągle przy łóżku: częstość akcji serca, saturację tlenu we krwi, częstość oddechów oraz średnie ciśnienie tętnicze. Aby zachować realistyczność sygnałów, usunięto oczywiście niemożliwe odczyty, a wszystkie pomiary podsumowano co godzinę. Każda godzina bez zarejestrowanej wartości danego parametru traktowana była jako brak. Choć brakowało tylko około 4% wszystkich wartości, zespół stwierdził, że te luki nie były rozproszone losowo — często skupiały się później w 48‑godzinnym oknie i czasami dotyczyły jednocześnie kilku parametrów życiowych.

Jak odtworzono luki znane z praktyki klinicznej

Zamiast tworzyć czysto sztuczne wzorce braków, autorzy zbudowali trzy scenariusze inspirowane obserwacjami surowych danych i tym, co klinicyści widzą przy łóżku pacjenta. W pierwszym pojedyncze odczyty były usuwane losowo, naśladując sporadyczne utraty pomiarów. W drugim znikały 1–3 godzinne bloki obejmujące wszystkie cztery parametry, co reprezentuje sytuacje, gdy pacjent jest poza monitorami — na przykład podczas badania obrazowego. W trzecim jeden parametr — na przykład ciśnienie krwi — był usunięty na ciągły 4‑godzinny odcinek, oddając awarię czujnika lub odklejenie sondy. Każdy scenariusz usuwał około 30% danych, czego celem było poważne sprawdzenie każdej metody rekonstruującej pierwotne przebiegi.

Stare triki kontra nowoczesna inteligencja maszynowa

Zespół porównał ze sobą szeroki zestaw metod rekonstrukcji. Proste, sprawdzone sposoby obejmowały wypełnianie każdej luki średnią wartością pacjenta, przenoszenie ostatniego zaobserwowanego odczytu (last observation carried forward) lub rysowanie linii prostej między najbliższymi znanymi punktami. Bardziej zaawansowane narzędzia statystyczne próbowały przewidywać brakujące wartości na podstawie pozostałych parametrów, ale przy tym musiały spłaszczyć wymiar czasu i traktować każdą godzinę jak kolejny wiersz tabeli. Na drugim biegunie znalazły się modele uczenia głębokiego — Transformery, sieci rekurencyjne i modele generatywne — które jawnie uczą się wzorców w czasie i między zmiennymi. Wszystkie modele trenowano na danych, w których losowo ukryto 30% wartości, a następnie testowano w każdym z trzech scenariuszy maskowania. Oceny wydajności opierały się na odległości rekonstrukcji od oryginalnych wartości, ze szczególnym uwzględnieniem błędów w średnim ciśnieniu tętniczym, kluczowym sygnale do zarządzania krążeniem.

Co działało, kiedy i o ile

Ogólnie rzecz biorąc, najbardziej wyrafinowane modele — szczególnie podejście oparte na Transformerze i sieć generatywna typu adversarial — osiągnęły najniższe średnie błędy, zwłaszcza gdy luki były krótkie lub rozproszone. Jednak skromna metoda interpolacji liniowej wypadła zaskakująco dobrze, w wielu sytuacjach zbliżając się do wyników modeli neuronowych. Narzędzia statystyczne ignorujące porządek pomiarów, takie jak lasy losowe czy modelowanie z łańcuchami równań, pozostawały w tyle mimo swojej złożoności. Kształt luk również miał znaczenie. Gdy wartości brakowały losowo, wszystkie metody prezentowały lepsze wyniki, dając zbyt optymistyczny obraz ich dokładności. Długie, ciągłe przerwy w zapisie, zwłaszcza rozciągające się na kilka godzin lub dotyczące jednego uszkodzonego czujnika, okazały się znacznie trudniejsze do poprawnego odtworzenia. W tych trudniejszych warunkach najlepsze metody uczenia głębokiego degradowały się łagodniej niż proste podejścia, ale zyski często były umiarkowane po przeliczeniu na rzeczywiste jednostki ciśnienia krwi.

Dlaczego wyniki mają znaczenie dla decyzji przy łóżku pacjenta

W zakresie codziennych wartości ciśnienia krwi różnica między najlepszymi modelami uczenia głębokiego a prostą interpolacją często wynosiła tylko kilka milimetrów słupa rtęci — zazwyczaj zbyt mało, by zmienić decyzję lekarza. Jednak wszystkie metody, łącznie z najnowocześniejszymi, miały problemy przy bardzo niskich lub bardzo wysokich wartościach ciśnienia — właśnie w tych momentach, gdy uważny monitoring jest najważniejszy. Badanie konkluduje, że wybór sposobu postępowania z brakującymi danymi na OIT zależy równie mocno od zrozumienia, jak i gdzie powstają luki, co od wyboru najnowszego algorytmu. Wyrafinowane modele mogą przynieść przyrostowe korzyści, szczególnie przy dłuższych lub bardziej złożonych lukach, ale proste, przejrzyste metody mogą być wystarczające dla wielu praktycznych zastosowań. Co istotne, lepsze uzupełnianie luk nie gwarantuje automatycznie lepszych modeli predykcyjnych; przyszłe prace muszą sprawdzić, jak wybory rekonstruujące wpływają na rzeczywiste decyzje kliniczne.

Cytowanie: Poette, M., Mouysset, S., Ruiz, D. et al. Benchmarking imputation strategies for missing time-series data in critical care using real-world-inspired scenarios. Sci Rep 16, 8116 (2026). https://doi.org/10.1038/s41598-026-39035-z

Słowa kluczowe: szeregi czasowe OIT, brakujące dane, metody imputacji, uczenie głębokie, parametry życiowe