Clear Sky Science · ru

CardioEHR: продольный набор электронных медицинских записей пациентов с сердечно-сосудистыми заболеваниями из центрального Китая

· Назад к списку

Почему эти долгосрочные данные о сердце важны

Болезни сердца — главная причина смерти в мире, но врачам и политикам часто не хватает подробной, реальной информации о том, как пациенты перемещаются по системе здравоохранения на протяжении многих лет. В этом исследовании представлен CardioEHR — большой, тщательно анонимизированный набор госпитальных записей десятков тысяч пациентов с сердечно-сосудистыми заболеваниями из центрального Китая. Охватывая как период до, так и после COVID-19, набор данных предоставляет редкую возможность проследить, как люди обращаются за помощью, как развивается их болезнь и как изменения в политике и обществе влияют на повседневную медицинскую практику.

Figure 1
Figure 1.

Десятилетие реальной жизни в больнице

CardioEHR объединяет два крупных набора электронных медицинских записей из Wuhan Union Hospital, крупного медицинского центра в центральном Китае. Один набор получен из более старой больничной системы, которая отслеживала пациентов с 2010 по 2020 годы; другой — из новой, ориентированной на исследования платформы, охватывающей 2011–2024 годы. В сумме ресурс включает более 70 000 пациентов, чье лечение в основном связано с сердечными и сопутствующими хроническими состояниями. Для каждого человека данные содержат базовые характеристики, такие как возраст и пол, выписки и поступления в больницу, диагнозы, результаты лабораторных исследований (включая тесты на COVID-19) и место проживания. Поскольку записи простираются на многие годы, исследователи могут отслеживать, как со временем меняется уход за пациентом, а не видеть только отдельные госпитализации.

Кто эти пациенты и как они проходят лечение

Авторы изучили, как пациенты перемещаются между отделениями больницы и как это изменилось между более старой и новой системами записей. В ранней когортe большинство людей были в возрасте от 50 до 70 лет и поступали и выписывались из кардиологического отделения, что отражает стабильный поток пожилых пациентов с серьезными сердечными проблемами. Переводы в другие отделения были менее частыми, но указывали на наличие у некоторых пациентов нескольких хронических заболеваний. В более поздней когорте типичный пациент был несколько моложе и поступал в больницу через более широкий спектр отделений, с более частыми переходами между службами. Эта картина свидетельствует о том, что новая система фиксирует более широкий и сложный набор заболеваний, давая более полное представление о пересечении сердечно-сосудистых проблем с другими состояниями.

Роль места и времени

Вне стен больницы команда связала деидентифицированный район проживания каждого пациента с публичной статистикой из China Statistical Yearbook, такой как местный доход, число больниц, доступные койки и число врачей. Это позволяет исследователям изучать, как богатство района и ресурсы здравоохранения соотносятся с тем, кто госпитализируется и как часто возвращается. Авторы также проанализировали ежемесячную динамику числа визитов и интервалы между повторными визитами. Они обнаружили регулярные шаблоны последующего наблюдения у этих хронически больных пациентов, а также изменения с течением лет, которые могут отражать реформы в здравоохранении, сезонные эффекты или нарушения и адаптации, вызванные пандемией COVID-19.

Как защищается конфиденциальность при сохранении полезных деталей

Чтобы сделать CardioEHR безопасным для совместного использования, команда применила строгую многоступенчатую процедуру удаления прямых идентификаторов и размывания чувствительных деталей без разрушения медицинской картины. Имена, номера удостоверений, точные адреса и телефонные номера были удалены, а каждому человеку присвоен однонаправленный зашифрованный код, чтобы записи по-прежнему можно было связывать между таблицами. Фактические календарные даты были сдвинуты на случайную величину, уникальную для каждого пациента, сохраняя порядок и интервалы между визитами, но скрывая реальные даты. Диагнозы были сопоставлены со стандартными кодами, редкие метки сгруппированы, а лабораторные тесты приведены к общим единицам и проверены на выбросы. Финальный набор данных организован в пять чистых таблиц — данные о пациентах, визитах, диагнозах, лабораторных тестах и региональных социально-экономических показателях — для каждой из двух когорт, все они доступны по контролируемому соглашению об использовании данных.

Figure 2
Figure 2.

Что этот ресурс значит для будущего здравоохранения

Проще говоря, CardioEHR — это долгий анонимизированный дневник о том, как десятки тысяч людей с сердечными и сопутствующими заболеваниями взаимодействуют с системой здравоохранения Китая на протяжении более десяти лет. Поскольку он объединяет клинические детали, условия жизни и уникальный период до и после COVID-19, он может помочь ученым создавать лучшие прогнозные модели, политикам оценивать влияние реформ, а больницам понимать, где уход работает, а где отстает. Тщательно балансируя конфиденциальность и детальность, набор данных открывает мощное новое окно в исследование сердечно-сосудистого здоровья и организации медицинской помощи в одной из крупнейших по населению стран мира.

Цитирование: Zha, L., Fu, C., Sha, X. et al. CardioEHR: A longitudinal electronic health record dataset of cardiovascular patients from central China. Sci Data 13, 451 (2026). https://doi.org/10.1038/s41597-026-06855-7

Ключевые слова: пациенты с сердечно-сосудистыми заболеваниями, электронные медицинские записи, данные китайских больниц, продольный набор данных о здоровье, использование здравоохранения во время COVID-19