Clear Sky Science · ru
Иерархическая конформная система для прогнозирования продолжительности пребывания с учётом неопределённости в мультибольничных условиях
Почему прогнозы длительности пребывания важны
Когда кого‑то госпитализируют, один из первых вопросов, который задают родственники и персонал: «Как долго он здесь пробудет?» Ответ важен не только ради любопытства: он определяет доступность койко‑мест, расписание смен персонала, планирование работы операционных и даже решение о том, может ли пациент безопасно выписаться домой или потребуется дополнительная поддержка. В этой статье описан новый подход к прогнозированию продолжительности пребывания, который даёт не просто одно число, а реалистичный интервал, отражающий неопределённость прогноза — критически важный для безопасной и эффективной помощи.
Сложности прогнозирования времени в больнице
Прогнозировать продолжительность пребывания сложнее, чем кажется. В больницах лечат широкий спектр пациентов — от рутинных случаев до сложных неотложных состояний — и практики различаются в зависимости от размера, формы собственности, статуса учебного заведения и региона. Это означает, что пациенты «группируются» по больницам и регионам, и их исходы не являются независимыми. Многие современные модели машинного обучения выдают лишь наилучшую оценку, но дают мало надёжной информации о том, насколько она может ошибаться. Для руководителей больниц, которым нужно избегать переполнения палат или пустующих коек, отсутствие оценки неопределённости может приводить к небезопасным выпискам, ненужным отменам процедур или расточительной практике «на всякий случай».

Сочетание двух подходов к неопределённости
Авторы изучили два популярных подхода к учёту неопределённости и обнаружили, что каждый сам по себе имеет серьёзные ограничения. Байесовские методы напрямую моделируют неопределённость и могут отражать сложные структуры, такие как больницы, вложенные в регионы, но на практике их интервалы могут быть излишне уверенными, если допущения модели хоть немного неверны. Конформное предсказание, напротив, почти не делает предположений о данных и может гарантировать, что интервалы будут содержать истинный результат выбранный процент времени, но обычно даёт интервалы одинаковой ширины для всех пациентов, не учитывая, насколько трудно предсказать конкретный случай. Ключевая идея этой работы — создать гибрид, который использует сильные стороны обоих подходов: байесовское моделирование для оценки того, какие пациенты более или менее неопределённы, и конформное предсказание для обеспечения общей надёжности интервалов.
Как гибридная система работает на практике
Система начинается с «иерархического случайного леса», древовидной модели машинного обучения, которая распознаёт закономерности на трёх уровнях: отдельные пациенты, их больницы и более широкие регионы, которым принадлежат эти больницы. На основе этой модели байесовский слой анализирует остаточные ошибки и оценивает, насколько неопределённа каждая новая предсказанная величина, учитывая особенности больницы и региона. Отдельно этап конформной калибровки исследует прошлые ошибки предсказаний на тысячах пациентов и определяет, какой должна быть ширина интервалов, чтобы достигнуть желаемого уровня надёжности — примерно 95 процентов в этом исследовании. Затем гибрид масштабирует эти конформные поправки вверх для случаев, которые байесовский слой считает рискованными, и вниз для случаев, которые он считает простыми, создавая индивидуальные интервалы для пациентов, которые одновременно осторожны и экономны по ширине.

Что говорят данные о качестве работы
Авторы протестировали свою схему на более чем 61 000 госпитализаций из почти 3 800 больниц США в национальной базе стационаров. Чистое конформное предсказание почти точно достигало целевого уровня 95 процентов, но использовало по сути одинаково широкий интервал для всех. Чисто байесовское дополнение давало очень узкие интервалы, но лишь в ~14 процентах случаев содержало истинную продолжительность пребывания — что слишком мало для безопасного применения. Гибридный подход приблизился к целевому значению, покрывая около 94,3 процента случаев, при этом умеренно сократив среднюю ширину интервала и, что важнее, перераспределив ширину: примерно на 21 процент уже интервалы для наименее неопределённых пациентов и примерно на 6 процентов шире для наиболее неопределённых. Эти адаптивные интервалы оставались стабильными для разных типов больниц и даже при тестировании модели на полностью новых учреждениях.
Что это значит для пациентов и больниц
Для неспециалистов главный вывод в том, что этот метод превращает «чёрный ящик» предсказаний в инструмент с понятными и надёжными границами погрешности. Вместо одной шаткой цифры больницы получают интервалы, подкреплённые статистикой и меняющиеся в зависимости от сложности случая: уже для рутинных пациентов, шире для тех, кто может удивить клиницистов. Это упрощает реальное планирование коек и смен, одновременно указывая, какие пациенты требуют повышенного внимания и планов на случай непредвиденного развития. Хотя текущие интервалы всё ещё относительно широки в днях календаря, предложенная структура демонстрирует, как тщательная статистика может перевести работу больниц от догадок к более надёжным решениям с учётом неопределённости, что поддерживает и безопасность, и эффективность.
Цитирование: Shahbazi, M.A., Baheri, A. & Azadeh-Fard, N. A hierarchical conformal framework for uncertainty-aware length of stay prediction in multi-hospital settings. Sci Rep 16, 6564 (2026). https://doi.org/10.1038/s41598-026-37450-w
Ключевые слова: продолжительность пребывания в больнице, квантирование неопределённости, конформное предсказание, байесовское моделирование, аналитика здравоохранения