Clear Sky Science · pl

CardioEHR: Długookresowy zestaw elektronicznych dokumentacji medycznych pacjentów kardiologicznych ze środkowych Chin

· Powrót do spisu

Dlaczego te długoterminowe dane o sercu mają znaczenie

Choroby serca są główną przyczyną zgonów na świecie, a mimo to lekarzom i decydentom często brakuje szczegółowych, rzeczywistych informacji o tym, jak pacjenci poruszają się w systemie ochrony zdrowia przez wiele lat. W tym badaniu przedstawiono CardioEHR — dużą, starannie zanonimizowaną kolekcję dokumentacji szpitalnej pochodzącą od dziesiątek tysięcy pacjentów kardiologicznych ze środkowych Chin. Obejmuje ona zarówno lata przed, jak i po COVID-19, dając rzadką perspektywę na to, jak ludzie szukają pomocy, jak przebiega ich choroba oraz jak zmiany w polityce i społeczeństwie wpływają na codzienną praktykę medyczną.

Figure 1
Figure 1.

Dekada prawdziwego życia szpitalnego

CardioEHR łączy dwa duże zbiory elektronicznych dokumentacji medycznych ze szpitala Wuhan Union, ważnego centrum medycznego w środkowych Chinach. Jeden zestaw pochodzi ze starszego systemu szpitalnego, który śledził pacjentów w latach 2010–2020; drugi — z nowszej, badawczej platformy obejmującej lata 2011–2024. Łącznie zasób obejmuje ponad 70 000 pacjentów, których opieka koncentruje się głównie na chorobach serca i pokrewnych schorzeniach przewlekłych. Dla każdej osoby dane zawierają podstawowe cechy, takie jak wiek i płeć, przyjęcia i wypisy ze szpitala, rozpoznania, wyniki badań laboratoryjnych (w tym testy na COVID-19) oraz miejsce zamieszkania. Ponieważ zapisy rozciągają się na wiele lat, badacze mogą obserwować, jak opieka nad pacjentem zmienia się w czasie, zamiast widzieć jedynie izolowane pobyty szpitalne.

Kto to są ci pacjenci i jak poruszają się w systemie opieki

Autorzy przeanalizowali przepływ pacjentów pomiędzy różnymi oddziałami szpitalnymi oraz to, jak zmienił się on między starszym i nowszym systemem rejestracji. W wcześniejszej kohorcie większość osób miała od 50 do 70 lat i była przyjmowana oraz wypisywana na oddział kardiologiczny, co odzwierciedla stały napływ starszych pacjentów z poważnymi schorzeniami serca. Przekierowania na inne oddziały występowały rzadziej, ale wskazywały na pacjentów z wieloma chorobami przewlekłymi. W późniejszej kohorcie przeciętny pacjent był nieco młodszy i trafiał do szpitala przez szerszy wachlarz oddziałów, z częstszymi przemieszczaniami między usługami. Ten wzorzec sugeruje, że nowszy system rejestracji obejmuje szersze i bardziej złożone spektrum schorzeń, dając pełniejszy obraz tego, jak problemy kardiologiczne współwystępują z innymi chorobami.

Rola miejsca i czasu

Później, poza murami szpitala, zespół powiązał każde zanonimizowane miejsce zamieszkania pacjenta ze statystykami publicznymi z China Statistical Yearbook, takimi jak lokalne dochody, liczba szpitali, dostępne łóżka i liczba lekarzy. Dzięki temu badacze mogą badać, jak bogactwo sąsiedztwa i zasoby zdrowotne wiążą się z tym, kto trafia do szpitala i jak często powraca. Autorzy przeanalizowali także miesięczne trendy w liczbie wizyt oraz odstępy czasowe między kolejnymi wizytami. Odkryli regularne wzorce kontrolne u tych przewlekle chorych pacjentów oraz zmiany w czasie, które mogą odzwierciedlać reformy zdrowotne, efekty sezonowe lub zakłócenia i adaptacje wywołane przez pandemię COVID-19.

Jak chronić prywatność przy zachowaniu użyteczności danych

Aby uczynić CardioEHR bezpiecznym do udostępniania, zespół zastosował ścisły, wieloetapowy proces usuwania identyfikatorów bezpośrednich i rozmywania wrażliwych szczegółów bez zniszczenia medycznej narracji. Usunięto imiona, numery identyfikacyjne, dokładne adresy i numery telefonów, a każdej osobie przypisano jednostronnie szyfrowany kod, dzięki czemu jej zapisy nadal można łączyć w różnych tabelach. Rzeczywiste daty kalendarzowe zostały przesunięte o losową wartość unikalną dla każdego pacjenta, zachowując kolejność i odstępy między wizytami, ale ukrywając prawdziwe daty. Rozpoznania przypisano do standardowych kodów, rzadkie etykiety połączono w grupy, a wyniki badań laboratoryjnych skonwertowano do wspólnych jednostek i sprawdzono pod kątem odchyleń. Końcowy zestaw danych jest zorganizowany w pięć przejrzystych tabel — dane o pacjentach, wizytach, rozpoznaniach, badaniach laboratoryjnych oraz regionalnych wskaźnikach społeczno-ekonomicznych — dla każdej z dwóch kohort, wszystkie dostępne na podstawie kontrolowanej umowy o korzystaniu z danych.

Figure 2
Figure 2.

Co ten zasób oznacza dla przyszłości zdrowia

Mówiąc prosto, CardioEHR to długi, zanonimizowany dziennik tego, jak dziesiątki tysięcy osób z chorobami serca i schorzeniami pokrewnymi wchodzą w interakcje z chińskim systemem opieki zdrowotnej przez ponad dekadę. Ponieważ łączy szczegóły kliniczne, warunki życia oraz unikalny okres przed i po COVID-19, może pomóc naukowcom w tworzeniu lepszych narzędzi prognostycznych, decydentom w ocenie wpływu reform, a szpitalom w zrozumieniu, gdzie opieka działa dobrze, a gdzie wymaga poprawy. Dzięki ostrożnemu zrównoważeniu prywatności i szczegółowości, zestaw danych otwiera potężne nowe okno na zdrowie sercowo-naczyniowe i świadczenie opieki zdrowotnej w jednej z największych populacji na świecie.

Cytowanie: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7

Słowa kluczowe: pacjenci kardiologiczni, elektroniczne dokumentacje medyczne, dane szpitalne z Chin, długookresowy zestaw danych zdrowotnych, korzystanie z opieki zdrowotnej w czasie COVID-19