Clear Sky Science · ru

Сравнительная эффективность LLM и машинного обучения в прогнозировании осложнений после чрескожной кифопластики при остеопоротических компрессионных переломах позвоночника

2026-04-01 · Назад к списку

Почему это важно для людей с хрупким позвоночником

По мере того как все больше людей доживают до пожилого возраста, болезненные переломы позвоночника из‑за истончения костной ткани становятся все более распространёнными. Широко применяемая процедура — чрескожная кифопластика — может быстро облегчить боль, но также несёт риск нежелательных последствий. В этом исследовании ставится вопрос, могут ли современные инструменты искусственного интеллекта, включая крупные языковые модели, похожие на популярные чат‑боты, помочь врачам предсказать, какие пациенты с большей вероятностью столкнутся с осложнениями после терапии.

Figure 1. Сравнение инструментов ИИ и хирургов с целью предсказать, какие пациенты со спинальными повреждениями могут столкнуться с утечкой цемента или новыми переломами после лечения.

Проблема в спине и её распространённое лечение

Остеопоротические компрессионные переломы позвонков возникают, когда ослабленные кости позвоночника проседают, часто после незначительного падения или даже при обычных бытовых нагрузках. Чрескожная кифопластика направлена на стабилизацию таких переломов путём введения баллона и заполнения образовавшегося пространства костным цементом, что обычно уменьшает боль и частично восстанавливает высоту разрушенного позвонка. Однако цемент иногда может вытечь за пределы кости, а через месяцы в других отделах позвоночника могут появиться новые переломы. Эти осложнения способны вызывать серьёзные проблемы, включая повреждение нервов, лёгочные осложнения и постоянную боль, поэтому врачи заинтересованы в инструментах, способных заранее выявлять пациентов с высоким риском перед операцией.

Классические компьютерные модели и человеческая оценка

До появления крупных языковых моделей исследователи создавали традиционные системы машинного обучения, которые выявляли закономерности в медицинских записях и снимках. Эти системы могут оценивать вероятность утечки цемента или появления новых переломов, комбинируя множество факторов, таких как возраст, плотность кости, форма перелома и распределение цемента. Одновременно опытные спинальные хирурги формируют собственное суждение на основе тех же данных. Хотя старые компьютерные модели часто показывают хорошие результаты, они требуют тщательной подготовки, технической экспертизы и вычислительных ресурсов, что ограничивает их применение в повседневной клинической практике.

Испытание чат‑ботов

В этом исследовании учёные собрали данные более чем от тысячи пациентов, прошедших кифопластику в крупной больнице в Пекине. Для каждого пациента фиксировали стандартную клиническую и визуализационную информацию, после чего просили две крупные языковые модели, набор традиционных моделей машинного обучения и двух спинальных хирургов предсказать, произойдёт ли утечка костного цемента и появятся ли позже новые переломы. Чат‑боты тестировали в двух режимах. В режиме «zero‑shot» им просто предоставляли данные случая и просили дать прогноз. В режиме «few‑shot» им сначала показывали небольшой набор примеров с известными исходами, чтобы посмотреть, улучшится ли их точность при обучении на примерах.

Figure 2. Как разные системы ИИ обрабатывают данные о состоянии позвоночника пациента, чтобы предсказать благополучное заживление по сравнению с утечкой цемента или будущими переломами.

Что правильно и что ошибочно у компьютеров и хирургов

При прогнозировании утечки цемента вскоре после операции крупные языковые модели показали умеренно хорошие результаты. Их показатели были сопоставимы с лучшими традиционными компьютерными моделями и несколько превосходили решения хирургов, работающих без помощи. Что касается прогнозирования новых переломов через месяцы, то тут чат‑боты испытывали трудности. Их первоначальные предсказания были плохими и сильно смещёнными в сторону предположения, что новые переломы коснутся почти всех пациентов. Представление примеров помогло частично, но традиционное машинное обучение, особенно модель опорных векторов, по‑прежнему работало более надёжно. Чат‑боты также не справлялись с задачей точной идентификации подтипов осложнений, например с указанием точного места утечки цемента или того, какой именно позвонок сломается следующим.

Помощь врачам, но пока не самостоятельный инструмент

Интересное наблюдение состоит в том, что хирурги иногда выигрывали от просмотра объяснений, сгенерированных чат‑ботами, но только в тех задачах, где сами модели уже показывали относительно хорошие результаты. Когда исходные предсказания были слабы, например при отдалённых по времени переломах, объяснения не улучшали решения врачей. В целом исследование показывает, что современные крупные языковые модели могут быть полезной поддержкой для оценки определённых краткосрочных рисков после кифопластики, но они ещё недостаточно надёжны, чтобы заменить существующие компьютерные модели или экспертную оценку. Пока их следует рассматривать как предварительные помощники, требующие доработки, лучшей подготовки на медицинских данных и более тесной интеграции с инструментами визуализации, прежде чем они смогут безопасно руководить реальной спинальной помощью.

Цитирование: Wang, T., Chen, R., Liang, M. et al. Comparative performance of LLMs and machine learning in predicting complications after percutaneous kyphoplasty for osteoporotic vertebral compression fractures. npj Digit. Med. 9, 401 (2026). https://doi.org/10.1038/s41746-026-02588-4

Ключевые слова: остеопоротические переломы позвоночника, чрескожная кифопластика, крупные языковые модели, машинное обучение в медицине, прогнозирование хирургического риска