Clear Sky Science · ru

APMSR: интеллектуальная система ответов на вопросы для синтетической биологии с адаптивным побуждением и многоканальным извлечением знаний

· Назад к списку

Более умные ответы для новой биологии

Синтетическая биология обещает более чистое топливо, экологичные производства и новые медицинские методы, но сама наука развивается настолько быстро, что даже специалисты не всегда успевают за новыми результатами. В этом исследовании представлена APMSR — интеллектуальная система ответов на вопросы, созданная, чтобы помогать исследователям быстро находить надежные сведения о ключевом микроорганизме для биотоплива, Zymomonas mobilis. Объединив модели большого языка с тщательно подобранными онлайновыми и оффлайновыми источниками, система стремится давать точные, актуальные ответы, а не уверенные, но ошибочные догадки.

Figure 1
Figure 1.

Проблема правильной постановки вопросов

Ученые уже пользуются поисковыми системами и онлайн‑базами данных, но эти инструменты часто возвращают длинные списки статей вместо прямых ответов. Модели большого языка (LLM) умеют плавно рассуждать на множество тем, однако в быстро меняющихся областях, таких как синтетическая биология, они могут пропускать недавние открытия или даже «выдумывать» факты. Авторы сосредоточились на практической задаче — ответах на вопросы экспертного уровня о Z. mobilis, бактерии, ценимой за высокую эффективность превращения сахаров в этанол. В этом контексте неправильные ответы — не просто неприятность, они могут привести к ошибочным экспериментам и неверным инвестиционным решениям.

Направление ИИ с помощью правильных инструкций

Ключевая идея в APMSR — то, как вы формулируете инструкцию модели, имеет такое же значение, как и то, что вы спрашиваете. Вместо одной фиксированной инструкции система сначала просит LLM определить тип вопроса — например, множественный выбор или утверждение «истинно/ложно». После распознавания типа APMSR автоматически выбирает соответствующий «шаблон подсказки», который указывает модели, как рассуждать и как форматировать ответ. Вопросы с множественным выбором, например, побуждают модель тщательно сравнивать варианты, тогда как для «истинно/ложно» акцент делается на проверке корректности утверждения и объяснении причин. Такое адаптивное побуждение помогает удерживать модель в фокусе и уменьшает отвлеченные, не по теме ответы.

Выбор лучших источников для поиска фактов

Один только правильный инструктаж недостаточен — системе нужно искать в нужных местах. APMSR подключается к трем видам источников информации: локальной библиотеке курируемых научных статей, актуальным веб‑ресурсам и гибриду, объединяющему оба типа. Для каждого запроса система рассматривает эти три варианта как конкурирующие «пути» и использует математическую стратегию LinUCB, изначально созданную для балансирования риска и выгоды в задачах принятия решений. LinUCB оценивает, насколько хорошо каждый путь сработал на основе предыдущих вопросов и их результатов, затем выбирает путь, наиболее вероятно приведущий к правильному ответу, одновременно время от времени испытав альтернативы. Со временем этот обратный цикл обучения показывает системе, какие комбинации источников оказываются наиболее надежными для разных типов вопросов.

Figure 2
Figure 2.

Испытание системы

Чтобы проверить, действительно ли эти идеи помогают, команда собрала специализированный тестовый набор из 220 экспертных вопросов о Z. mobilis, поровну разделенных между форматами множественного выбора и «истинно/ложно», все вопросы были получены из рецензируемых исследований. Они сравнили три конфигурации: голую LLM без внешних документов, стандартную систему с извлечением только из локальной базы и полную систему APMSR. Точность выросла с 54% для голой модели до 80% при стандартном извлечении, а затем до 93% после добавления адаптивных подсказок и селектора путей на основе LinUCB. Оптимизированная система также опередила существующую модель, ориентированную на синтетическую биологию, SynBioGPT, примерно на 19 процентных пунктов, что указывает на то, что умная оркестровка подсказок и извлечения может быть важнее простого увеличения размера модели.

Что это значит для будущей лабораторной работы

Для неспециалистов главный вывод в том, что авторы создали нечто вроде «исследовательского копилота», который не только говорит бегло, но и умеет проверять несколько источников и структурировать собственное мышление. Настраивая и форму постановки вопросов, и способы сбора информации, APMSR заметно сокращает число вводящих в заблуждение ответов в сложной, быстро развивающейся области. Хотя текущая система сосредоточена на одном микроорганизме и вопросах в формате викторины, тот же подход можно расширить на более широкие области биологии и дальше, помогая ученым, инженерам и, возможно, в будущем клиницистам задавать лучшие вопросы и получать более надежные ответы от ИИ-инструментов.

Цитирование: Wang, J., Cao, Z., Tian, Z. et al. APMSR: an intelligent QA system for synthetic biology empowered by adaptive prompting and multi-source knowledge retrieval. Sci Rep 16, 7331 (2026). https://doi.org/10.1038/s41598-026-38006-8

Ключевые слова: синтетическая биология, ответы на вопросы, модели большого языка, генерация с поддержкой извлечения, Zymomonas mobilis