Clear Sky Science · zh
APMSR:一种通过自适应提示与多源知识检索赋能的合成生物学智能问答系统
为一种新型生物学提供更聪明的答案
合成生物学承诺带来更清洁的燃料、更环保的工厂和新的医疗疗法,但该领域的发展速度如此之快,即便是专家也难以跟上。本研究提出了APMSR,一种智能问答系统,旨在帮助研究人员快速找到关于一种关键生物燃料微生物Zymomonas mobilis的可靠答案。通过将大语言模型与精心选择的在线和离线资源相结合,该系统力求提供精确、最新的答案,而不是自信却错误的推测。

提出好问题的挑战
科学家已经依赖搜索引擎和在线数据库,但这些工具通常返回大量论文列表而非直接答案。大语言模型(LLM)能流利地讨论许多话题,然而在像合成生物学这样发展迅速的领域,它们可能错过最新发现或凭空编造信息。作者关注的实际问题是如何回答关于Z. mobilis的专家级问题,这种细菌因高效将糖转化为乙醇而备受重视。在这种情境下,错误答案不仅令人恼火——还可能把实验和投资引向错误方向。
用合适的指令引导 AI
APMSR 的一个核心思想是,如何向模型提问与所问内容同样重要。系统并非使用单一固定指令,而是首先让 LLM 判定所见问题的类型——例如多项选择题或判断题。一旦识别出题型,APMSR 会自动选择匹配的“提示模板”,告诉模型应如何推理以及如何格式化答案。比如多项选择题会被引导去仔细比较选项,而判断题则被引导去核查陈述的正确性并解释原因。这种自适应提示有助于让模型保持聚焦,减少漫无边际或离题的回答。
选择最佳事实来源
仅有良好指令还不足够;系统还必须去对的地方查找信息。APMSR 连接了三类信息源:经人工筛选的本地科学论文库、实时网络资源,以及将两者合并的混合资源。对于每个用户查询,系统将这三种选择视为竞争的“路径”,并使用一种名为 LinUCB 的数学策略——该策略最初用于在决策问题中平衡风险与回报。LinUCB 根据以往问题及其结果评估每条路径的表现,然后选择最有可能产生正确答案的路径,同时仍偶尔尝试其他选项。随着时间推移,这一反馈循环教会系统在不同问题类型下哪些信息源组合更可信。

对系统进行测试
为了检验这些想法是否真正有效,团队构建了一个针对Z. mobilis的 220 道专家问题的专业测试集,均匀分为多项选择题和判断题,所有题目均来自同行评议的研究。他们比较了三种设置:未接入外部文档的裸 LLM、仅使用本地数据库的标准检索增强系统,以及完整的 APMSR 设计。准确率从裸模型的 54% 提升到使用标准检索时的 80%,在加入自适应提示和基于 LinUCB 的路径选择器后进一步提升到 93%。优化后的系统还比一个名为 SynBioGPT 的现有合成生物学专用模型高出约 19 个百分点,这表明精妙地协调提示与检索可能比单纯训练更大的模型更为重要。
这对未来实验室工作的意义
对非专业人士来说,主要结论是作者构建了一种“研究协同助手”,它不仅能以流利的语言交流,还知道何时查证多个来源以及如何组织自身的推理。通过同时调整问题的表述方式和信息的检索方式,APMSR 在复杂且快速演进的领域里大幅减少了误导性答案。尽管当前系统侧重于单一微生物和测验式问题,但相同方法可扩展到更广泛的生物学领域乃至其他学科,帮助科学家、工程师,甚至未来的临床工作者提出更好的问题并从 AI 工具那里获得更可靠的答案。
引用: Wang, J., Cao, Z., Tian, Z. et al. APMSR: an intelligent QA system for synthetic biology empowered by adaptive prompting and multi-source knowledge retrieval. Sci Rep 16, 7331 (2026). https://doi.org/10.1038/s41598-026-38006-8
关键词: 合成生物学, 问答, 大语言模型, 检索增强生成, Zymomonas mobilis