Clear Sky Science · es

CardioEHR: un conjunto de registros electrónicos de salud longitudinales de pacientes cardiovasculares del centro de China

· Volver al índice

Por qué importan estos datos cardiacos a largo plazo

La enfermedad cardíaca es la principal causa de muerte en todo el mundo, pero médicos y responsables de políticas a menudo carecen de información detallada y del mundo real sobre cómo los pacientes transitan por el sistema sanitario a lo largo de muchos años. Este estudio presenta CardioEHR, una gran colección cuidadosamente anonimizada de historiales hospitalarios de decenas de miles de pacientes cardiovasculares en el centro de China. Al cubrir los años tanto antes como después de la COVID-19, el conjunto de datos ofrece una ventana poco común sobre cómo las personas buscan atención, cómo evolucionan sus enfermedades y cómo los cambios en la política y la sociedad afectan la práctica médica cotidiana.

Figure 1
Figure 1.

Una década de vida hospitalaria real

CardioEHR reúne dos grandes conjuntos de registros electrónicos de salud del Wuhan Union Hospital, un importante centro médico del centro de China. Un conjunto procede de un sistema hospitalario más antiguo que siguió a los pacientes de 2010 a 2020; el otro procede de una plataforma más nueva y orientada a la investigación que abarca de 2011 a 2024. En total, el recurso incluye a más de 70 000 pacientes cuya atención se centra principalmente en el corazón y en afecciones crónicas relacionadas. Para cada persona, los datos incluyen características básicas como edad y sexo, ingresos y altas hospitalarias, diagnósticos, resultados de pruebas de laboratorio (incluidas pruebas de COVID-19) y su lugar de residencia. Dado que los registros se extienden a lo largo de muchos años, los investigadores pueden seguir cómo cambia la atención de un paciente a lo largo del tiempo en lugar de ver solo estancias hospitalarias aisladas.

Quiénes son estos pacientes y cómo se mueven por la atención

Los autores examinaron cómo los pacientes fluyen entre distintos departamentos hospitalarios y cómo esto ha cambiado entre los sistemas de registro antiguo y nuevo. En la cohorte anterior, la mayoría de las personas tenían entre 50 y 70 años y eran ingresadas y dadas de alta desde el departamento de cardiología, lo que refleja un flujo constante de pacientes de edad avanzada con problemas cardíacos graves. Las transferencias a otros departamentos eran menos frecuentes, pero apuntaban a pacientes con múltiples enfermedades crónicas. En la cohorte más reciente, el paciente típico era algo más joven y entraba al hospital por una mezcla más amplia de departamentos, con movimientos más frecuentes entre servicios. Este patrón sugiere que el sistema más nuevo captura una mezcla más amplia y compleja de enfermedades, ofreciendo una imagen más completa de cómo los problemas cardiovasculares se intersectan con otras afecciones.

El papel del lugar y el tiempo

Más allá de los muros del hospital, el equipo vinculó la región de residencia desvinculada de cada paciente con estadísticas públicas del China Statistical Yearbook, como ingresos locales, número de hospitales, camas disponibles y número de médicos. Esto permite a los investigadores estudiar cómo la riqueza del vecindario y los recursos sanitarios se relacionan con quiénes son hospitalizados y con qué frecuencia regresan. Los autores también analizaron las tendencias mensuales en el número de visitas y el tiempo entre visitas repetidas. Encontraron patrones regulares de seguimiento en estos pacientes crónicos, así como cambios a lo largo de los años que pueden reflejar reformas sanitarias, efectos estacionales o las interrupciones y adaptaciones provocadas por la pandemia de COVID-19.

Cómo se protege la privacidad manteniendo los detalles útiles

Para hacer CardioEHR seguro para compartir, el equipo aplicó un proceso estricto y en múltiples pasos para eliminar identificadores directos y difuminar detalles sensibles sin destruir la historia médica. Se eliminaron nombres, números de identificación, direcciones exactas y números de teléfono, y a cada persona se le asignó un código cifrado unidireccional para que sus registros pudieran seguir vinculándose entre tablas. Las fechas del calendario reales se desplazaron por una cantidad aleatoria única para cada paciente, preservando el orden y la separación de sus visitas pero ocultando las fechas reales. Los diagnósticos se mapearon a códigos estándar, las etiquetas raras se agruparon y las pruebas de laboratorio se convirtieron a unidades comunes y se comprobaron los valores atípicos. El conjunto de datos final se organiza en cinco tablas limpias—detalles del paciente, visitas, diagnósticos, pruebas de laboratorio e indicadores socioeconómicos regionales—para cada una de las dos cohortes, todas accesibles bajo un acuerdo de uso de datos controlado.

Figure 2
Figure 2.

Qué significa este recurso para la salud futura

En términos sencillos, CardioEHR es un diario largo y anonimizado de cómo decenas de miles de personas con enfermedades cardíacas y relacionadas interactúan con el sistema sanitario chino durante más de una década. Al combinar detalles clínicos, condiciones de vida y el periodo único antes y después de la COVID-19, puede ayudar a los científicos a desarrollar mejores herramientas de predicción, a los responsables de políticas a probar el impacto de reformas y a los hospitales a entender dónde la atención funciona o falla. Al equilibrar cuidadosamente la privacidad con el detalle, el conjunto de datos abre una nueva y potente ventana hacia la salud cardiovascular y la prestación de atención sanitaria en una de las poblaciones más grandes del mundo.

Cita: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7

Palabras clave: pacientes cardiovasculares, registros electrónicos de salud, datos hospitalarios de China, conjunto de datos de salud longitudinal, uso sanitario durante COVID-19