Clear Sky Science · it
CardioEHR: un dataset longitudinale di cartelle cliniche elettroniche di pazienti cardiovascolari dalla Cina centrale
Perché questi dati cardiaci a lungo termine sono importanti
Le malattie cardiache sono la principale causa di morte nel mondo, eppure medici e decisori spesso non dispongono di informazioni dettagliate e reali su come i pazienti attraversano il sistema sanitario nel corso di molti anni. Questo studio presenta CardioEHR, un'ampia raccolta accuratamente anonimizzata di cartelle cliniche ospedaliere di decine di migliaia di pazienti cardiovascolari nella Cina centrale. Coprendo gli anni sia precedenti sia successivi al COVID-19, il dataset offre una rara finestra su come le persone cercano cure, come si sviluppano le loro malattie e come i cambiamenti nelle politiche e nella società si ripercuotono sulla pratica medica quotidiana.

Un decennio di vita ospedaliera reale
CardioEHR unisce due grandi serie di cartelle cliniche elettroniche dellOspedale Wuhan Union, un importante centro medico nella Cina centrale. Una serie proviene da un sistema ospedaliero più vecchio che ha tracciato i pazienti dal 2010 al 2020; laltra proviene da una piattaforma più recente, orientata alla ricerca, che copre il periodo 2011–2024. In totale, la risorsa comprende più di 70.000 pazienti la cui cura è incentrata principalmente sul cuore e sulle condizioni croniche correlate. Per ciascuna persona, i dati includono caratteristiche di base come età e sesso, ricoveri e dimissioni ospedaliere, diagnosi, risultati di esami di laboratorio (inclusi i test per COVID-19) e il luogo di residenza. Poiché i record si estendono su molti anni, i ricercatori possono seguire come le cure di un paziente cambiano nel tempo invece di vedere solo ricoveri isolati.
Chi sono questi pazienti e come si muovono nel percorso di cura
Gli autori hanno esaminato come i pazienti fluiscono attraverso i diversi reparti ospedalieri e come questo sia cambiato tra il sistema di registrazione più vecchio e quello più nuovo. Nella coorte precedente, la maggior parte delle persone aveva un’età compresa tra i 50 e i 70 anni ed era ricoverata e dimessa dal reparto di cardiologia, riflettendo un flusso costante di pazienti anziani con gravi problemi cardiaci. I trasferimenti ad altri reparti erano meno comuni ma indicavano la presenza di pazienti con più malattie croniche. Nella coorte più recente, il paziente tipico era leggermente più giovane ed entrava in ospedale attraverso un mix più ampio di reparti, con spostamenti più frequenti tra i servizi. Questo schema suggerisce che il sistema più recente cattura un ventaglio più ampio e complesso di patologie, offrendo un quadro più completo di come i problemi cardiovascolari si intrecciano con altre condizioni.
Il ruolo del luogo e del tempo
Oltre le mura ospedaliere, il team ha collegato la regione di residenza de-identificata di ciascun paziente a statistiche pubbliche tratte dallAnnuario Statistico della Cina, come reddito locale, numero di ospedali, letti disponibili e numero di medici. Ciò permette ai ricercatori di studiare come la ricchezza del quartiere e le risorse sanitarie siano correlate a chi viene ricoverato e con quale frequenza ritorna. Gli autori hanno inoltre analizzato le tendenze mensili nel numero di visite e ltempo tra visite ripetute. Hanno riscontrato schemi regolari di follow-up in questi pazienti cronici, così come cambiamenti negli anni che possono riflettere riforme sanitarie, effetti stagionali o le interruzioni e le adattazioni causate dalla pandemia di COVID-19.
Come viene protetta la privacy mantenendo utili i dettagli
Per rendere CardioEHR condivisibile in sicurezza, il team ha applicato un rigoroso processo in più fasi per rimuovere gli identificatori diretti e sfumare i dettagli sensibili senza distruggere la storia clinica. Nomi, numeri di documento, indirizzi esatti e numeri di telefono sono stati rimossi e a ciascuna persona è stato assegnato un codice crittografato a senso unico in modo che i loro record potessero ancora essere collegati tra le tabelle. Le date del calendario reali sono state spostate di un valore casuale unico per ogni paziente, preservando l’ordine e gli intervalli tra le visite ma nascondendo le date reali. Le diagnosi sono state mappate su codici standard, le etichette rare sono state raggruppate e gli esami di laboratorio sono stati convertiti in unità comuni e controllati per valori anomali. Il dataset finale è organizzato in cinque tabelle pulite—dati anagrafici dei pazienti, visite, diagnosi, esami di laboratorio e indicatori socioeconomici regionali—for each of the two cohorts, tutte accessibili sotto un accordo controllato di utilizzo dei dati.

Che cosa significa questa risorsa per la salute futura
In termini semplici, CardioEHR è un lungo diario anonimizzato di come decine di migliaia di persone con malattie cardiache e correlate interagiscono con il sistema sanitario cinese per più di un decennio. Poiché combina dettagli clinici, condizioni di vita e il periodo unico prima e dopo il COVID-19, può aiutare gli scienziati a costruire migliori strumenti predittivi, i responsabili delle politiche a testare l’impatto delle riforme e gli ospedali a capire dove l’assistenza funziona o è carente. Bilanciando con attenzione privacy e dettaglio, il dataset apre una nuova e potente finestra sulla salute cardiovascolare e sull’erogazione delle cure in una delle popolazioni più numerose al mondo.
Citazione: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7
Parole chiave: pazienti cardiovascolari, cartelle cliniche elettroniche, dati ospedalieri Cina, dataset sanitario longitudinale, uso sanitario durante COVID-19