Clear Sky Science · ru

EPEE: к эффективным и результативным базовым моделям в биомедицине

2026-05-12 · Назад к списку

Почему важно, чтобы ИИ думал быстрее в медицине

Современный искусственный интеллект умеет с впечатляющим мастерством читать медицинские карты и анализировать изображения, но в реальных больницах каждая секунда на счету. Врачам в отделениях неотложной помощи и реанимации нельзя ждать, пока большая модель медленно «переберёт» десятки слоёв, особенно если дополнительные шаги не улучшают ответ. В этом исследовании предложен способ помочь крупным медицинским системам ИИ понять, когда они уже видели достаточно для безопасного и уверенного решения, экономя время и вычислительные ресурсы без ущерба для точности.

Figure 1. Как медицинский ИИ может завершать обработку досрочно для простых случаев, чтобы давать более быстрые решения без потери точности

Проблема медлительного и чрезмерно осторожного ИИ

Крупные «фундаментальные» модели лежат в основе многих недавних достижений в медтехе. Языковые модели помогают просеивать электронные медицинские записи и научные статьи, а визуальные модели анализируют изображения, такие как рентгеновские снимки и срезы тканей. При этом эти модели строятся из множества последовательно расположенных слоёв, которые неоднократно обрабатывают один и тот же ввод. На практике поздние слои часто дают мало добавочной пользы и даже могут ухудшать точность — проблему, которую авторы называют «перераздумывание» (overthinking). Для врача, ожидающего риск‑оценку или сигнал об опасном взаимодействии препаратов, эта лишняя вычислительная возня превращается в реальные задержки и увеличение расходов на вычисления.

Позволяя простым случаям завершаться раньше

Ранее предлагали подход «раннего выхода», при котором модель включает небольшие проверочные точки между слоями. Если на проверке уже достаточно высокая уверенность в ответе, модель может остановиться там, вместо того чтобы прогонять данные через все оставшиеся слои. Одна группа методов решает на основе уверенности: если предсказание явно сосредоточено на одном варианте, модель выходит. Эти подходы просты и гибки, но при настройке на скорость могут терять в точности. Другая группа ждёт согласия нескольких слоёв подряд — правило «терпения», которое лучше сохраняет точность, но чувствительно к числу требуемых совпадений, что затрудняет настройку под разные клинические потребности.

Гибридный ранний выход под названием EPEE

Авторы представляют EPEE, сокращение от Entropy- and Patience-based Early Exiting, которое объединяет обе идеи. На каждом слое трансформерной модели EPEE подключает лёгкий классификатор. Система проверяет два простых условия: достаточно ли уверено текущее предсказание и делали ли недавние слои последовательно одно и то же заключение? Если выполняется любое из условий, модель останавливается и возвращает результат. Настраивая порог «уверенности» и число повторных соглашений, пользователи могут регулировать и скорость, и осторожность. Важно, что авторы показывают: старые методы, основанные только на уверенности или только на терпении, являются частными случаями этой более общей стратегии.

Figure 2. Как модель ИИ использует многослойные точки выхода: простые входы останавливаются рано, а сложные проходят глубже перед принятием решения

Испытания на реальных медицинских текстах и изображениях

Чтобы проверить работоспособность EPEE на практике, команда протестировала его на трёх типах биомедицинских задач: классификации заметок или обзоров, выявлении отношений, например взаимодействий лекарств, и извлечении медицинских событий из текста. Они использовали восемь популярных фундаментальных моделей, включая языковые модели вроде BERT и GPT-2 и визуальный трансформер для медицинских изображений. На двенадцати наборах данных, взятых из записей интенсивной терапии, отзывов пациентов, медицинской литературы и коллекций изображений, таких как рентген груди и мазки крови, они сравнили EPEE со стандартным полным проходом и с ранними методами выхода. Во многих случаях модель достигала лучшей или почти лучшей точности на промежуточных слоях, то есть принуждение использовать все слои было избыточным. EPEE использовал это, позволяя простым случаям выходить раньше, в то время как более сложные проходили дальше.

Баланс между скоростью и надёжностью в клинике

При измерении времени работы EPEE стабильно снижал задержку вывода по сравнению как с обычными моделями полной глубины, так и с предыдущими методами раннего выхода, часто сокращая эффективные вычисления при сохранении или незначительном улучшении точности. Метод требовал лишь небольших дополнительных затрат при обучении и одинаково хорошо работал как для языковых, так и для визуальных моделей, включая более крупные биомедицинские модели. Благодаря двум настраиваемым параметрам, позволяющим выбирать компромисс между скоростью и корректностью, EPEE особенно пригоден для таких областей, как реанимация, где быстрые ответы важны, а ошибки дорого обходятся.

Что это значит для будущего медицинского ИИ

Проще говоря, эта работа учит большие медицинские модели ИИ останавливаться, когда они уже знают ответ, вместо бесконечного перепроверения. Объединив два распространённых правила выхода в гибкую схему, EPEE показывает, что больницам не обязательно нужны ещё большие модели, чтобы получить лучшее качество — возможно, достаточно моделей, которые разумнее используют уже имеющиеся ресурсы. При широком внедрении такой подход к раннему выходу может помочь интегрировать мощные текстовые и визуальные модели в рабочие клинические процессы в реальном времени, обеспечивая более быстрые и при этом надёжные решения у постели пациента.

Цитирование: Zhan, Z., Zhou, S., Zhou, H. et al. EPEE: towards efficient and effective foundation models in biomedicine. npj Health Syst. 3, 30 (2026). https://doi.org/10.1038/s44401-026-00083-2

Ключевые слова: ранний выход, биомедицинский ИИ, базовые модели, эффективность модели, поддержка клинических решений