Clear Sky Science · fr

CardioEHR : un jeu de données longitudinal d dossiers de santé électroniques de patients cardiovasculaires du centre de la Chine

· Retour à l’index

Pourquoi ces données cardiaques à long terme sont importantes

Les maladies cardiaques sont la première cause de mortalité dans le monde, et pourtant médecins et décideurs disposent souvent de peu d’informations détaillées et réelles sur la manière dont les patients circulent dans le système de santé sur plusieurs années. Cette étude présente CardioEHR, une vaste collection d’enregistrements hospitaliers soigneusement anonymisés portant sur des dizaines de milliers de patients cardiovasculaires du centre de la Chine. Couvrant les années avant et après la COVID-19, le jeu de données offre une fenêtre rare sur la façon dont les personnes cherchent des soins, comment leurs maladies évoluent et comment les changements de politique et de société se répercutent sur la pratique médicale quotidienne.

Figure 1
Figure 1.

Une décennie de vie hospitalière réelle

CardioEHR rassemble deux grands ensembles de dossiers de santé électroniques de l’hôpital Wuhan Union, un centre médical majeur du centre de la Chine. Un ensemble provient d’un système hospitalier ancien qui suivait les patients de 2010 à 2020 ; l’autre provient d’une plateforme plus récente, orientée recherche, qui couvre 2011 à 2024. Au total, la ressource comprend plus de 70 000 patients dont les soins portent principalement sur le cœur et les affections chroniques associées. Pour chaque personne, les données incluent des caractéristiques de base comme l’âge et le sexe, les admissions et sorties hospitalières, les diagnostics, les résultats d’analyses de laboratoire (y compris les tests COVID-19) et le lieu de résidence. Comme les dossiers s’étendent sur de nombreuses années, les chercheurs peuvent suivre comment les soins d’un patient évoluent dans le temps plutôt que de ne voir que des séjours hospitaliers isolés.

Qui sont ces patients et comment ils circulent dans les soins

Les auteurs ont examiné les parcours des patients entre différents services hospitaliers et la manière dont cela a changé entre l’ancien et le nouveau système de dossiers. Dans la cohorte antérieure, la majorité des personnes avaient entre 50 et 70 ans et étaient admises et sorties du service de cardiologie, reflétant un flux constant de patients âgés présentant des problèmes cardiaques graves. Les transferts vers d’autres services étaient moins fréquents mais indiquaient des patients atteints de plusieurs maladies chroniques. Dans la cohorte plus récente, le patient type était un peu plus jeune et entrait à l’hôpital par une plus grande variété de services, avec des déplacements plus fréquents entre services. Ce schéma suggère que le système plus récent capture un mélange d’affections plus large et plus complexe, donnant une image plus complète de la façon dont les problèmes cardiovasculaires s’entrelacent avec d’autres pathologies.

Le rôle du lieu et du temps

Au-delà des murs de l’hôpital, l’équipe a relié la région de résidence dé-identifiée de chaque patient à des statistiques publiques tirées de l’Annuaire statistique de la Chine, telles que le revenu local, le nombre d’hôpitaux, les lits disponibles et le nombre de médecins. Cela permet aux chercheurs d’étudier comment la richesse du quartier et les ressources sanitaires influent sur qui est hospitalisé et à quelle fréquence il revient. Les auteurs ont également analysé les tendances mensuelles du nombre de visites et l’intervalle entre visites successives. Ils ont constaté des schémas réguliers de suivi chez ces patients chroniquement malades, ainsi que des changements au fil des années qui peuvent refléter des réformes de santé, des effets saisonniers ou les perturbations et adaptations induites par la pandémie de COVID-19.

Comment la confidentialité est protégée tout en conservant des détails utiles

Pour rendre CardioEHR sûr à partager, l’équipe a mis en œuvre un processus strict en plusieurs étapes pour supprimer les identifiants directs et estomper les informations sensibles sans détruire le récit médical. Les noms, numéros d’identification, adresses exactes et numéros de téléphone ont été supprimés, et à chaque personne a été attribué un code chiffré unidirectionnel permettant de lier ses enregistrements entre les tables. Les dates calendaires réelles ont été décalées d’un montant aléatoire propre à chaque patient, préservant l’ordre et l’écart entre les visites tout en masquant les dates réelles. Les diagnostics ont été mappés à des codes standard, les étiquettes rares ont été regroupées, et les analyses de laboratoire ont été converties en unités communes et contrôlées pour les valeurs aberrantes. Le jeu de données final est organisé en cinq tables nettoyées — détails des patients, visites, diagnostics, analyses de laboratoire et indicateurs socioéconomiques régionaux — pour chacune des deux cohortes, toutes accessibles sous un accord d’utilisation des données contrôlé.

Figure 2
Figure 2.

Ce que cette ressource signifie pour la santé future

Simplement, CardioEHR est un long journal anonymisé de la manière dont des dizaines de milliers de personnes atteintes de maladies cardiaques et associées interagissent avec le système de santé chinois sur plus d’une décennie. Parce qu’il combine détails cliniques, conditions de vie et la période unique avant et après la COVID-19, il peut aider les scientifiques à construire de meilleurs outils de prédiction, les décideurs à tester l’impact des réformes, et les hôpitaux à comprendre où les soins fonctionnent ou sont insuffisants. En conciliant soigneusement confidentialité et détail, le jeu de données ouvre une nouvelle fenêtre puissante sur la santé cardiovasculaire et la délivrance des soins dans l’une des plus grandes populations du monde.

Citation: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7

Mots-clés: patients cardiovasculaires, dossiers de santé électroniques, données hospitalières de Chine, jeu de données longitudinal de santé, utilisation des soins pendant la COVID-19