Clear Sky Science · ru
AIM review tool: искусственный интеллект для более умного скрининга систематических обзоров
Почему сортировку научных исследований пора переосмыслить
Ежедневно учёные публикуют тысячи новых исследований — гораздо больше, чем любая команда исследователей успеет подробно прочесть. Когда рекомендации по здравоохранению или крупные научные решения зависят от аккуратного обобщения доказательств в систематических обзорах, эксперты могут тратить месяцы лишь на то, чтобы отсортировать, какие статьи имеют значение. В этой статье представлено средство AIM Review — веб‑система, использующая искусственный интеллект прямо в браузере, чтобы помочь исследователям быстрее находить важные исследования, сократить рутинную работу и повысить прозрачность процесса.
Как превратить поток статей в управляемый поток
Систематические обзоры стремятся ответить на конкретные вопросы — например, работает ли лечение — путём поиска по нескольким базам данных и последующего скрининга всех потенциально релевантных статей. Этап скрининга медленный и утомительный: команды могут начинать с десятков тысяч заголовков и аннотаций и вручную решать, какие из них читать полностью. Существующие инструменты ИИ помогают приоритизировать записи, но часто опираются на закрытые, непрозрачные алгоритмы или требуют сложной настройки ПО. AIM Review спроектирован как открытый, настраиваемый и простой в запуске прямо в веб‑браузере, чтобы исследователи могли лучше понимать и контролировать, как ИИ принимает решения.

Как инструмент учится на решениях людей
AIM Review сочетает два основных подхода машинного обучения. Во‑первых, он использует активное обучение для поддержки приоритизации в реальном времени. Пока рецензенты помечают статьи как «релевантные» или «нерелевантные», система учится находить закономерности в формулировках заголовков и аннотаций. Затем она переставляет оставшиеся статьи так, чтобы те, которые с большей вероятностью релевантны, появлялись раньше в очереди на скрининг. Под капотом программное обеспечение переводит текст в числовые «отпечатки» с помощью разных методов — от простого подсчёта слов до продвинутых языковых моделей — и затем передаёт их в классификаторы, такие как логистическая регрессия или опорные векторы. За счёт объединения или слияния этих различных представлений текста AIM Review способен улавливать как базовые ключевые слова, так и более глубокий смысл языка.
Сокращение объёма работы в реальных систематических обзорах
Авторы протестировали AIM Review на шести завершённых систематических обзорах в областях психологии, психиатрии, информатики, эндокринологии и экологии здоровья. В моделируемых запусках активное обучение существенно уменьшило число статей, которые нужно было проверять вручную, при этом по‑прежнему находя по крайней мере 95% действительно релевантных исследований. В зависимости от редкости релевантных работ «сэкономленная работа» варьировала от примерно 20% до 95%. Например, в обзоре с более чем 16 000 статей, но очень малым числом релевантных, система могла бы сократить ручной скрининг со всех записей до примерно 2400, при этом захватив почти все важные исследования. В областях, где много работ оказываются релевантными, экономия была меньше, но всё ещё значима.
Предсказание релевантности для полуавтоматизации скрининга
Активное обучение по‑прежнему предполагает, что люди в конечном счёте просмотрят большую часть записей с высоким приоритетом. Чтобы пойти дальше, AIM Review добавляет режим контролируемого обучения на основе вложенной кросс‑валидации — строгого способа построения и тестирования моделей. После того как рецензенты вручную пометят часть статей (например, 20%), инструмент обучает и настраивает модели для предсказания того, какие из оставшихся 80% вероятно релевантны. В рассматриваемых случаях эти модели достигали сбалансированной точности примерно от 75% до 87%, что означает, что они достаточно хорошо находили релевантные статьи и отклоняли нерелевантные. Разные стратегии предлагали компромиссы: стек моделей часто давал немного большую точность, но рисковал переобучением, тогда как простое слияние всех текстовых признаков обычно лучше обобщалось на новые данные.

От ручной рутиной к направляемой, прозрачной помощи ИИ
AIM Review организован в три связанных модуля: приложение для маркировки, где выполняется скрининг с активным обучением; приложение для согласования, которое сравнивает решения разных рецензентов; и приложение для предсказания, которое обучает контролируемые модели и маркирует непросмотренные записи. Всё запускается локально в браузере, что защищает конфиденциальность данных и исключает сложные установки. Авторы подчёркивают, что инструмент не заменяет экспертную оценку. Скорее он помогает командам тратить меньше времени на повторяющуюся сортировку и больше времени на оценку качества и значения наиболее перспективных исследований. Их результаты показывают, что при осторожном использовании браузерный ИИ может сделать крупные, надёжные сводки доказательств более выполнимыми — особенно в областях, где объём исследований в противном случае перегрузил бы людей‑рецензентов.
Что это означает для будущего сбора доказательств
Для неспециалиста ключевая мысль в том, что более умное программное обеспечение может сократить скрытые, трудоёмкие этапы, лежащие в основе медицины и политики, основанных на доказательствах. Обучаясь на решениях рецензентов и строго проверяя собственные предсказания, AIM Review предлагает практичный способ ускорить систематические обзоры, не превращая их в «чёрный ящик». При широком распространении такие инструменты могут помочь обеспечить, чтобы рекомендации, медицинские советы и научные синтезы успевали за быстро растущим объёмом исследований.
Цитирование: Mena, S., Rituerto-González, E., Coutts, F. et al. AIM review tool: artificial intelligence for smarter systematic review screening. npj Artif. Intell. 2, 25 (2026). https://doi.org/10.1038/s44387-026-00080-8
Ключевые слова: систематические обзоры, машинное обучение, скрининг литературы, инструменты искусственного интеллекта, синтез доказательств