Clear Sky Science · ru

Безопасный контроль доступа к электронным медицинским записям с использованием блокчейна, шифрования по двойным атрибутам и извлечения атрибутов на основе больших языковых моделей

2026-02-17 · Назад к списку

Почему вашим медицинским записям нужны более умные «замки»

Каждый визит к врачу оставляет цифровой след — заметки, результаты анализов, снимки — часто хранящиеся в разных больницах и облачных системах. Эти записи жизненно важны для качественной помощи, но если доступ к ним слишком открыт, под угрозой оказывается ваша приватность; если же они закрыты слишком плотно, врачи могут не увидеть важную информацию вовремя. В этой статье представлен новый подход к защите электронных медицинских записей, который позволяет правомочным людям видеть только нужные фрагменты данных пациента, даже если эти записи разбросаны по сети.

Проблема универсальных правил приватности

Сегодня многие больницы защищают данные широкими правилами: если вы кардиолог в определённой клинике, вам может быть открыт доступ к большей части карты сердца пациента. Но современные записи гораздо сложнее — они полны свободного текста, изображений и отчётов, написанных в повседневном клиническом языке. Простые правила часто терпят неудачу в этой запутанной реальности: они могут раскрывать детали сотрудникам, которым это не нужно, или блокировать информацию, необходимую специалистам. По мере того как всё больше записей переходит в облако и обменивается между учреждениями, риск утечек, подглядывания и фальсификации данных растёт.

Пусть данные описывают сами себя

Авторы утверждают, что решения об доступе должны зависеть не только от того, кто запрашивает доступ, но и от того, что содержится в самих данных. Для этого они используют медицинскую языковую модель ClinicalBERT — вид ИИ, обученный на реальных клинических заметках. Вместо того чтобы оставлять текст неструктурированным, модель сканирует записи в поисках ключевых идей — таких как симптомы, диагнозы, лекарства и процедуры — и превращает их в структурированные теги. Например, предложение о «грудной боли» и «инсулине» становится коротким списком стандартизированных понятий. Это позволяет системе понимать, что данный документ, скажем, относится к кардиологии и связан с диабетом, не раскрывая при этом полный текст.

Построение тонко настроенных «замков» с помощью шифрования и блокчейна

После разметки записей система применяет методику, называемую шифрованием на основе атрибутов: данные шифруются так, что расшифровать их могут только пользователи, характеристики которых соответствуют заданному правилу. Здесь характеристики исходят с двух сторон. Атрибуты пользователя отражают, кто он такой — например, его специальность или отделение — в то время как атрибуты данных берутся из тегов, сгенерированных ClinicalBERT, например тип заболевания или уровень чувствительности. Таким образом, запись можно зашифровать по политике вроде «только нефрологи видят результаты анализов, связанные с функцией почек» или «только небольшая бригада скорой помощи имеет доступ к пометкам высокой конфиденциальности». Ключи, необходимые для соблюдения этих правил, создаются совместно несколькими независимыми центрами выдачи ключей, чтобы ни одна отдельная власть не могла в одиночку тайно расшифровать данные.

Использование общего реестра для координации доверия

Чтобы отслеживать, какие атрибуты и ключи существуют, система опирается на приватный блокчейн на базе Hyperledger Fabric. В этот реестр записываются только технические метаданные — публичные ключи, анонимные идентификаторы атрибутов и информация о политиках — никогда не исходный медицинский текст. Поскольку каждая запись фиксируется в неизменяемой цепочке, разделяемой между больницами, инсайдеру трудно тихо изменить права доступа или подделать ключи. Смарт‑контракты в блокчейне автоматически рассчитывают комбинированные публичные ключи для новых атрибутов, обновляют или отзывают их при смене ролей персонала и помогают пациентам или учреждениям корректировать политики с течением времени. Самые зашифрованные медицинские файлы остаются вне цепочки в облачном хранилище, что делает блокчейн лёгким и масштабируемым.

Как система ведёт себя при атаках и на практике

Авторы проверили свою конструкцию как математически, так и на практике. С помощью формальных инструментов верификации они моделируют распространённые угрозы — такие как атаки повтора, сговор пользователей или любопытный облачный провайдер — и показывают, что атакующие не могут восстановить ключи расшифровки без правильной комбинации атрибутов. Поскольку ключи разделены между несколькими властями, не существует «мастер‑ключа», который можно было бы украсть. Они также протестировали систему на стандартном сервере и на маломощной плате Raspberry Pi, показав, что шифрование эффективно, а что важно — расшифровка быстрее, чем в нескольких конкурирующих схемах; это важно, потому что врачи могут многократно открывать одну и ту же запись, тогда как обычно она шифруется лишь однажды.

Что это значит для пациентов и клиницистов

Проще говоря, эта работа предлагает более умный «замок» для медицинских записей: такой, который учитывает и то, кто стучится, и что находится в комнате, прежде чем открыть дверь. Сочетая ИИ, понимающий медицинский язык, криптографию, задающую тонко настроенные правила, и блокчейн, которому доверяют все стороны, эта схема стремится позволить клиницистам видеть ровно то, что им нужно — ни больше, ни меньше — одновременно давая пациентам большую защиту от злоупотребления их данными. При широком внедрении такие системы могли бы сделать обмен записями между больницами более безопасным и плавным, не ставя людей перед выбором между приватностью и качественной медицинской помощью.

Цитирование: Nekouie, A., Vafaei Jahan, M., Moattar, M.H. et al. Secure electronic health record access control via blockchain, dual-attribute encryption, and large language model-based attribute extraction. Sci Rep 16, 8673 (2026). https://doi.org/10.1038/s41598-026-39690-2

Ключевые слова: электронные медицинские записи, конфиденциальность медицинских данных, блокчейн в здравоохранении, шифрование на основе атрибутов, клинические языковые модели