Clear Sky Science · ru
Точное автоматическое составление выписных эпикризов с помощью донастроенных больших языковых моделей и самооценки
Почему бумажная работа в больнице действительно важна
Когда пациент покидает больницу, история его болезни не заканчивается у дверей. Врачи в других клиниках, семейные врачи и сами пациенты полагаются на ключевой документ — выписной эпикриз, чтобы понять, что происходило в стационаре и какие мероприятия следует выполнить дальше. При этом составление таких эпикризов — медленный, повторяющийся труд, который может занимать у загруженных клиницистов полчаса и больше на одного пациента. В этом исследовании изучают, как современные языковые инструменты ИИ могут помочь быстрее и точнее готовить выписки, при этом сохраняя конфиденциальность данных пациентов и контроль со стороны больницы.
Преобразование раскиданных записей в понятный рассказ
Информация о пациентах хранится в разных электронных системах: результаты лабораторий в одной таблице, записи об операциях в другой, наблюдения медсестёр в третьей и так далее. За время пребывания пациента накапливаются тысячи мелких текстовых фрагментов. Исследователи сначала построили конвейер, который преобразует эти разрозненные, грязные данные в чистый входной материал, понятный модели ИИ. С помощью методов слияния и удаления дубликатов, фильтрации личных данных (таких как имена и идентификаторы), исправления орфографии и стандартизации медицинской терминологии они создали структурированный ввод для каждого случая пребывания. Этот процесс применили к данным более чем 6000 пациентов, оперированных по поводу заболеваний щитовидной железы в крупной китайской больнице, получив пары: реальные выписные эпикризы и исходные сырые данные, на основе которых они были составлены. 
Донастройка ИИ на язык медицины
Готовые большие языковые модели обучены на общем тексте из интернета и книг, поэтому им часто непросто с тематической медицинской лексикой и локальными стилями документации. Команда сравнила несколько способов «донастройки» существующих моделей, чтобы те лучше понимали китайские медицинские записи. Новый метод, названный разложением весов с низким ранговым приближением (weight-decomposed low-rank adaptation), или DoRA, корректирует внутренние веса модели более прицельно, чем более старые техники вроде LoRA и QLoRA. На разных моделях, включая Qwen2, Mistral и Llama 3, DoRA последовательно давала более плавные, более близкие по смыслу к человеческим и менее запутанные сводки (по метрике perplexity). По сути, DoRA помогла ИИ усвоить медицинскую фразеологию и терминологию без необходимости полного переобучения на массивном оборудовании.
Обучение ИИ проверять собственные результаты
Даже хорошо обученная модель может пропустить важные детали или внести мелкие ошибки, когда пишет длинный эпикриз за один раз. Черпая вдохновение из психологической идеи быстрого «Системы 1» мышления и более медленного, вдумчивого «Системы 2» рассуждения, авторы разработали цикл самооценки. Сначала модель генерирует первоначальный выписной эпикриз на основе обработанных данных. Затем исходные данные разбиваются на сегменты — например, результаты патологии, врачебные назначения или панели лабораторий — и каждый сегмент вновь сопоставляется с черновым эпикризом. Модели задаётся по сути вопрос: «Отражён ли в эпикризе всё из этого сегмента?» Если нет, она вносит правки, добавляя пропущенную или исправляя противоречивую информацию. Этот цикл повторяется до трёх раз или до момента, пока модель не сочтёт эпикриз завершённым, в результате получается уточнённая версия, которая точнее соответствует записи о пациенте. 
Насколько хорошо ИИ справился по сравнению с людьми?
Для оценки качества команда использовала как автоматические метрики, так и человеческих рецензентов. Врачи и медицинские исследователи оценивали эпикризы по точности, полноте, ясности, согласованности и полезности для дальнейшего ухода. Лучшая система — сочетание донастройки DoRA и цикла самооценки — была ближе всего к человеческим эпикризам по всем показателям. Особенно улучшилась полнота, то есть уменьшилось число пропущенных диагнозов, назначений или ключевых лабораторных значений. В подробном примере ИИ сначала забыл упомянуть небольшой рак щитовидной железы и конкретную гормональную таблетку; после двух проходов самооценки оба пункта были правильно добавлены. В среднем система формировала выписной эпикриз примерно за 80 секунд на сервере больницы, по сравнению с 30–50 минутами, которые требуются клиницисту для составления эпикриза с нуля, хотя человеческая проверка остаётся обязательной перед внесением текста в официальный документ.
Что это может значить для пациентов и врачей
Исследование показывает, что при аккуратной донастройке и встроенной самопроверке системы ИИ способны создавать выписные эпикризы, достаточно точные, чтобы считаться клинически приемлемыми после быстрой проверки человеком. Это не заменяет врачей, но позволяет сместить их работу от рутинной печати к более высокоуровневому контролю и принятию решений. Сохранение всех вычислений внутри больничной сети и удаление идентифицирующих данных также защищает приватность пациентов. Хотя результаты получены в одном отделении одной больницы, предложенная схема указывает на будущее, в котором ИИ помогает превращать сложные медицинские данные в ясные и надёжные описания по многим специальностям, поддерживая более безопасные передачи пациентов и лучшее понимание со стороны пациентов и их семей.
Цитирование: Li, W., Feng, H., Hu, C. et al. Accurate discharge summary generation using fine tuned large language models with self evaluation. Sci Rep 16, 5607 (2026). https://doi.org/10.1038/s41598-026-35552-z
Ключевые слова: выписные эпикризы, медицинский ИИ, большие языковые модели, клиническая документация, самооценка