Clear Sky Science · pt

CardioEHR: Um conjunto longitudinal de prontuários eletrônicos de pacientes cardiovasculares do centro da China

· Voltar ao índice

Por que esses dados cardíacos de longo prazo são importantes

Doença cardíaca é a principal causa de morte no mundo, contudo médicos e formuladores de políticas frequentemente carecem de informações detalhadas e reais sobre como os pacientes transitam pelo sistema de saúde ao longo de muitos anos. Este estudo apresenta o CardioEHR, uma grande coleção cuidadosamente anonimizada de registros hospitalares de dezenas de milhares de pacientes cardiovasculares no centro da China. Abrangendo tanto os anos antes quanto depois da COVID-19, o conjunto de dados oferece uma janela rara sobre como as pessoas procuram atendimento, como suas doenças evoluem e como mudanças em políticas e na sociedade repercutem na prática médica cotidiana.

Figure 1
Figure 1.

Uma década da vida real em hospitais

O CardioEHR reúne dois grandes conjuntos de prontuários eletrônicos do Wuhan Union Hospital, um importante centro médico no centro da China. Um conjunto vem de um sistema hospitalar mais antigo que acompanhou pacientes de 2010 a 2020; o outro provém de uma plataforma mais nova, voltada à pesquisa, que cobre de 2011 a 2024. No total, o recurso inclui mais de 70.000 pacientes cujo atendimento gira principalmente em torno de doenças cardíacas e condições crônicas relacionadas. Para cada pessoa, os dados incluem características básicas como idade e sexo, internações e altas hospitalares, diagnósticos, resultados de exames laboratoriais (incluindo testes de COVID-19) e local de residência. Como os registros se estendem por muitos anos, pesquisadores podem acompanhar como o atendimento de um paciente muda ao longo do tempo, em vez de ver apenas internações isoladas.

Quem são esses pacientes e como eles transitam pelo atendimento

Os autores examinaram como os pacientes fluem por diferentes departamentos hospitalares e como isso mudou entre o sistema de registros mais antigo e o mais novo. Na coorte anterior, a maioria das pessoas tinha entre 50 e 70 anos e era admitida e dada alta pelo departamento de cardiologia, refletindo um fluxo constante de pacientes mais velhos com problemas cardíacos graves. Transferências para outros departamentos eram menos comuns, mas indicavam pacientes com múltiplas doenças crônicas. Na coorte mais recente, o paciente típico era um pouco mais jovem e ingressava no hospital por uma mistura mais ampla de departamentos, com movimentações mais frequentes entre serviços. Esse padrão sugere que o sistema mais novo captura um conjunto mais amplo e mais complexo de doenças, oferecendo um quadro mais completo de como problemas cardiovasculares se cruzam com outras condições.

O papel do lugar e do tempo

Para além das paredes do hospital, a equipe vinculou a região de moradia desidentificada de cada paciente a estatísticas públicas do China Statistical Yearbook, como renda local, número de hospitais, leitos disponíveis e número de médicos. Isso permite que pesquisadores estudem como a riqueza do bairro e os recursos de saúde se relacionam com quem é hospitalizado e com que frequência retornam. Os autores também analisaram tendências mensais no número de visitas e o intervalo entre visitas repetidas. Eles encontraram padrões regulares de acompanhamento nesses pacientes cronicamente doentes, assim como mudanças ao longo dos anos que podem refletir reformas de saúde, efeitos sazonais ou as rupturas e adaptações trazidas pela pandemia de COVID-19.

Como a privacidade é protegida mantendo os detalhes úteis

Para tornar o CardioEHR seguro para compartilhamento, a equipe aplicou um processo rigoroso em várias etapas para remover identificadores diretos e obscurecer detalhes sensíveis sem destruir a narrativa clínica. Nomes, números de identificação, endereços exatos e telefones foram removidos, e cada pessoa recebeu um código criptografado unidirecional para que seus registros ainda pudessem ser vinculados entre tabelas. Datas do calendário reais foram deslocadas por um valor aleatório único para cada paciente, preservando a ordem e o espaçamento das visitas, mas ocultando as datas reais. Diagnósticos foram mapeados para códigos padrão, rótulos raros foram agrupados, e exames laboratoriais foram convertidos para unidades comuns e verificados quanto a valores discrepantes. O conjunto final de dados está organizado em cinco tabelas limpas — dados do paciente, visitas, diagnósticos, exames laboratoriais e indicadores socioeconômicos regionais — para cada uma das duas coortes, todos acessíveis sob um acordo controlado de uso de dados.

Figure 2
Figure 2.

O que esse recurso significa para a saúde futura

Em termos simples, o CardioEHR é um diário longo e anonimizado de como dezenas de milhares de pessoas com doenças cardíacas e relacionadas interagem com o sistema de saúde chinês ao longo de mais de uma década. Por combinar detalhes clínicos, condições de vida e o período único antes e depois da COVID-19, ele pode ajudar cientistas a construir melhores ferramentas de previsão, permitir que formuladores de políticas testem o impacto de reformas e auxiliar hospitais a entender onde o atendimento funciona ou falha. Ao equilibrar cuidadosamente privacidade com detalhe, o conjunto de dados abre uma nova janela poderosa sobre saúde cardiovascular e prestação de cuidados em uma das maiores populações do mundo.

Citação: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7

Palavras-chave: pacientes cardiovasculares, prontuários eletrônicos, dados hospitalares da China, conjunto longitudinal de saúde, uso de saúde durante COVID-19