Clear Sky Science · de

CardioEHR: Ein longitudinaler elektronischer Gesundheitsdatensatz von Herz-Kreislauf-Patienten aus Zentralchina

· Zurück zur Übersicht

Warum diese Langzeitdaten zum Herzen wichtig sind

Herzkrankheiten sind die weltweit führende Todesursache, doch Ärzten und Entscheidungsträgern fehlen häufig detaillierte, realweltliche Informationen darüber, wie sich Patienten über viele Jahre hinweg durch das Gesundheitssystem bewegen. Diese Studie stellt CardioEHR vor, eine große, sorgfältig anonymisierte Sammlung von Krankenhausakten von zehntausenden Herz-Kreislauf-Patienten in Zentralchina. Der Datensatz deckt sowohl die Jahre vor als auch nach COVID-19 ab und bietet ein seltenes Fenster darauf, wie Menschen Versorgung suchen, wie sich Erkrankungen entwickeln und wie Änderungen in Politik und Gesellschaft den Alltag in der medizinischen Praxis beeinflussen.

Figure 1
Figure 1.

Ein Jahrzehnt realen Krankenhauslebens

CardioEHR vereint zwei große Sätze elektronischer Gesundheitsakten des Wuhan Union Hospital, eines wichtigen medizinischen Zentrums in Zentralchina. Der eine Satz stammt aus einem älteren Krankenhausinformationssystem, das Patienten von 2010 bis 2020 verfolgte; der andere aus einer neueren, forschungsorientierten Plattform, die den Zeitraum 2011 bis 2024 abdeckt. Insgesamt umfasst die Ressource mehr als 70.000 Patienten, deren Versorgung sich hauptsächlich um Herz- und verwandte Langzeiterkrankungen dreht. Für jede Person enthalten die Daten grundlegende Merkmale wie Alter und Geschlecht, Klinikaufnahmen und -entlassungen, Diagnosen, Laborergebnisse (einschließlich COVID-19-Tests) und Wohnort. Da die Aufzeichnungen sich über viele Jahre erstrecken, können Forschende verfolgen, wie sich die Versorgung eines Patienten im Zeitverlauf verändert, anstatt nur einzelne Krankenhausaufenthalte zu sehen.

Wer diese Patienten sind und wie sie sich durch die Versorgung bewegen

Die Autoren untersuchten, wie Patienten durch verschiedene Krankenhausabteilungen fließen und wie sich dies zwischen dem älteren und dem neueren Aufzeichnungssystem verändert hat. In der früheren Kohorte waren die meisten Personen zwischen 50 und 70 Jahre alt und wurden in die Kardiologie aufgenommen und von dort entlassen, was einen stetigen Strom älterer Patienten mit schweren Herzerkrankungen widerspiegelt. Verlegungen in andere Abteilungen waren seltener, deuteten aber auf Patienten mit mehreren chronischen Erkrankungen hin. In der späteren Kohorte war der typische Patient etwas jünger und wurde über ein breiteres Spektrum von Abteilungen aufgenommen, mit häufigeren Wechseln zwischen den Diensten. Dieses Muster legt nahe, dass das neuere System ein breiteres und komplexeres Krankengemisch erfasst und so ein vollständigeres Bild davon vermittelt, wie Herz-Kreislauf-Probleme mit anderen Erkrankungen zusammenhängen.

Die Rolle von Ort und Zeit

Über die Krankenhausmauern hinaus verknüpfte das Team die de-identifizierte Heimatregion jedes Patienten mit öffentlichen Statistiken aus dem China Statistical Yearbook, wie lokalem Einkommen, Anzahl der Krankenhäuser, verfügbaren Betten und Ärztinnen und Ärzten. Dadurch können Forschende untersuchen, wie Nachbarschaftswohlstand und Gesundheitsressourcen damit zusammenhängen, wer hospitalisiert wird und wie häufig Rückkehraufnahmen erfolgen. Die Autorinnen und Autoren betrachteten außerdem monatliche Trends bei Besuchszahlen und die Zeitabstände zwischen wiederholten Besuchen. Sie fanden regelmäßige Muster von Nachsorge bei diesen chronisch Kranken sowie Veränderungen über die Jahre, die Gesundheitsreformen, saisonale Effekte oder die Störungen und Anpassungen durch die COVID-19-Pandemie widerspiegeln könnten.

Wie Privatsphäre geschützt wird und zugleich Details nützlich bleiben

Um CardioEHR sicher teilbar zu machen, wandte das Team einen strikten, mehrstufigen Prozess an, um direkte Identifikatoren zu entfernen und sensible Details zu verwischen, ohne die medizinische Aussage zu zerstören. Namen, Ausweisnummern, genaue Adressen und Telefonnummern wurden entfernt, und jede Person erhielt einen einseitig verschlüsselten Code, sodass ihre Datensätze weiterhin über Tabellen hinweg verknüpft werden können. Tatsächliche Kalenderdaten wurden für jede Person um eine zufällige, individuelle Zeitspanne verschoben, wodurch Reihenfolge und Abstände der Besuche erhalten blieben, die echten Daten aber verborgen sind. Diagnosen wurden auf standardisierte Codes abgebildet, seltene Bezeichnungen zusammengefasst, und Labortests in gebräuchliche Einheiten konvertiert sowie auf Ausreißer geprüft. Der endgültige Datensatz ist in fünf bereinigte Tabellen gegliedert — Patientendetails, Besuche, Diagnosen, Labortests und regionale sozioökonomische Indikatoren — für jede der beiden Kohorten, alle zugänglich unter einer kontrollierten Daten‑Nutzungsvereinbarung.

Figure 2
Figure 2.

Was diese Ressource für die künftige Gesundheit bedeutet

Einfach gesagt ist CardioEHR ein langes, anonymisiertes Tagebuch darüber, wie zehntausende Menschen mit Herz- und verwandten Erkrankungen über mehr als ein Jahrzehnt mit dem chinesischen Gesundheitssystem interagieren. Da es klinische Details, Lebensbedingungen und die einzigartige Periode vor und nach COVID-19 kombiniert, kann es Forschenden helfen, bessere Vorhersagemodelle zu entwickeln, Entscheidungsträgern ermöglichen, die Auswirkungen von Reformen zu testen, und Krankenhäusern aufzuzeigen, wo Versorgung funktioniert oder versagt. Indem es Privatsphäre und Detailreichtum sorgfältig austariert, öffnet der Datensatz ein kraftvolles neues Fenster in die kardiovaskuläre Gesundheit und die Versorgung in einer der größten Bevölkerungen der Welt.

Zitation: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7

Schlüsselwörter: Herz-Kreislauf-Patienten, elektronische Gesundheitsakten, Krankenhausdaten China, longitudinaler Gesundheitsdatensatz, COVID-19 Gesundheitsnutzung