Clear Sky Science · sv
CardioEHR: En longitudinell elektronisk journaldatamängd över kardiovaskulära patienter från mellersta Kina
Varför dessa långsiktiga hjärndata är viktiga
Hjärt-kärlsjukdom är den vanligaste dödsorsaken globalt, men läkare och beslutsfattare saknar ofta detaljerad, verklighetsnära information om hur patienter rör sig genom vårdsystemet över många år. Denna studie presenterar CardioEHR, en stor, noggrant anonymiserad samling sjukhusjournaler från tiotusentals kardiovaskulära patienter i mellersta Kina. Datasetet, som täcker både åren före och efter COVID-19, ger ett ovanligt fönster in i hur människor söker vård, hur sjukdomsförlopp utvecklas och hur förändringar i politik och samhälle påverkar vardaglig medicinsk praxis.

En decennium av verkligt sjukhusliv
CardioEHR sammanför två stora uppsättningar elektroniska patientjournaler från Wuhan Union Hospital, ett stort medicinskt centrum i mellersta Kina. Den ena uppsättningen kommer från ett äldre journalsystem som följde patienter mellan 2010 och 2020; den andra kommer från en nyare, forskningsinriktad plattform som sträcker sig från 2011 till 2024. Totalt innehåller resursen mer än 70 000 patienter vars vård framför allt kretsar kring hjärt- och relaterade kroniska tillstånd. För varje person ingår grundläggande egenskaper som ålder och kön, vårdinläggningar och utskrivningar, diagnoser, laboratorieresultat (inklusive COVID-19-tester) och bostadsort. Eftersom journalerna sträcker sig över många år kan forskare följa hur en patients vård förändras över tid i stället för att bara se enstaka sjukhusvistelser.
Vilka dessa patienter är och hur de rör sig genom vården
Författarna undersökte hur patienter fördelas mellan olika sjukhusavdelningar och hur detta förändrats mellan det äldre och det nyare journalsystemet. I den tidigare kohorten var de flesta mellan 50 och 70 år och skrevs in och ut från kardiologavdelningen, vilket speglar ett stadigt inflöde av äldre patienter med allvarliga hjärtproblem. Överföringar till andra avdelningar var mindre vanliga men antydde patienter med flera kroniska sjukdomar. I den senare kohorten var den typiska patienten något yngre och kom in via ett bredare spektrum av avdelningar, med mer frekventa förflyttningar mellan vårdenheter. Detta mönster tyder på att det nyare systemet fångar en bredare och mer komplex blandning av sjukdomar, vilket ger en mer komplett bild av hur kardiovaskulära problem samspelar med andra tillstånd.
Platsens och tidens roll
Bortom sjukhusets väggar kopplade teamet varje patients avidentifierade hemregion till offentliga statistikdata från Kina Statistical Yearbook, såsom lokal inkomst, antal sjukhus, tillgängliga sängar och antal läkare. Detta gör det möjligt att studera hur grannskapets välstånd och vårdresurser relaterar till vilka som blir inlagda och hur ofta de återkommer. Författarna analyserade också månatliga trender i antalet besök och tiden mellan återbesök. De fann regelbundna uppföljningsmönster hos dessa kroniskt sjuka patienter samt förändringar över åren som kan spegla hälso-reformer, säsongseffekter eller de störningar och anpassningar som COVID-19-pandemin medförde.
Hur integritet skyddas samtidigt som detaljer behålls
För att göra CardioEHR säkert att dela tillämpade teamet en strikt, flerstegsprocess för att ta bort direkt identifierande uppgifter och fördunkla känsliga detaljer utan att förstöra den medicinska berättelsen. Namn, ID-nummer, exakta adresser och telefonnummer togs bort, och varje person tilldelades en envägskrypterad kod så att deras journaler fortfarande kunde länkas över tabeller. Faktiska kalenderdatum försköts med ett slumpmässigt värde unikt för varje patient, vilket bevarade ordning och tidsavstånd mellan besök men dolde de verkliga datumen. Diagnoser kartlades till standardkoder, sällsynta etiketter grupperades, och laboratorietester konverterades till gemensamma enheter och kontrollerades för avvikande värden. Den slutliga datamängden är organiserad i fem rena tabeller — patientuppgifter, besök, diagnoser, labbtester och regionala socioekonomiska indikatorer — för vardera av de två kohorterna, alla tillgängliga under ett kontrollerat dataanvändaravtal.

Vad denna resurs betyder för framtida hälsa
I klara ordalag är CardioEHR en lång, anonymiserad dagbok över hur tiotusentals människor med hjärt- och relaterade sjukdomar interagerar med det kinesiska vårdsystemet under mer än ett decennium. Eftersom den kombinerar kliniska detaljer, levnadsförhållanden och den unika perioden före och efter COVID-19 kan den hjälpa forskare att bygga bättre prediktionsverktyg, beslutsfattare att testa effekterna av reformer och sjukhus att förstå var vården fungerar eller brister. Genom att noggrant balansera integritet och detaljrikedom öppnar datasetet ett kraftfullt nytt fönster in i kardiovaskulär hälsa och vårdgivning i en av världens största befolkningar.
Citering: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7
Nyckelord: kardiovaskulära patienter, elektroniska patientjournaler, sjukhusdata från Kina, longitudinell hälsodatamängd, COVID-19 vårdanvändning