Clear Sky Science · zh

使用在职学习的人工智能代理操作先进科学仪器

2026-03-06 · 返回目录

面向日常科学的更智能机器

从强大的X射线显微镜到机器人操作的化学实验室，现代科学工具能够比以往更快地收集数据。但操作这些设备仍需要专家的关注和精心的设置，这限制了使用者的范围和发现的速度。本文探讨了一代新的人工智能“代理”如何与人类科学家一同学习，以更安全、更灵活、更高效地操作复杂仪器。

从按键操作到学习伙伴

如今的先进实验室已对许多常规步骤实现自动化，但真正的独立性——例如规划实验、解释图像以及决定下一步该做什么——仍然难以实现。作者基于大语言模型（即驱动现代聊天机器人的那类人工智能），将它们转化为以目标为导向的代理，能够编写代码、调用软件工具，并对图像和视频作出反应。与其取代科学家，这些代理被设计为“人在回路”式工作：人们描述期望、在必要时提供修正，AI将这些经验记忆下来以供将来使用。

为X射线显微镜配备数字副驾驶

第一个测试平台是硬X射线纳探针束线，一台利用聚焦X射线以纳米尺度映射材料结构的设备。由于存在辐射危险，运行时房间内不得有人，整个系统由专用软件和脚本控制。团队将数个AI代理接入该控制系统：一个代理编写执行样品扫描所需的命令；另一个审查代码的安全性和正确性；视觉代理观察生成的图像并建议何处放大以便更细致查看。这些代理不仅要把普通语言请求翻译为正确的扫描命令，还要读取衍射和荧光图像中微小的亮点，并将它们的位置转化为新的精确扫描坐标。

AI做对的地方——以及它的困难所在

通过比较几种领先的具视觉能力的语言模型，研究者发现了明显的性能差异。有些模型擅长遵循文本指令并调用正确的函数，尤其在显示示例并由人类纠正后表现更好。另一些在视觉推理上更强，例如能够准确定位孤立的亮粒子，并在选择下一次扫描位置时避免拥挤的簇。该研究中表现突出的模型同时兼具这两项优点，并在重复试验中表现出最一致的行为。然而，作者也发现，反馈主要提升了基于文本的技能（如参数选择）；它并不能奇迹般地修复视觉理解的薄弱环节。

教机器人自行开展实验

第二个测试平台是用于制备薄聚合物膜的自动化站，该膜常用于电子和能源器件。这里，一只装有不同夹具的机械臂在各站点之间搬运小瓶、衬底、移液器吸头和刀片涂覆工具。研究者剥离了大多数高级例程，仅向代理提供底层指令和物品位置信息图。AI必须阅读科学论文以提取合适的涂覆条件，规划一长串步骤——例如拾取衬底、将其放入涂布器、打开小瓶、分配溶液并在受控温度和速度下展开——然后生成并验证执行这些操作的机器人代码。人工监管者批准每个新的序列，他们的修正被存储在记忆系统中，以便代理今后重复使用成功模式。

迈向自动驾驶实验室

在X射线束线和机器人制备平台中，这项研究表明AI代理可以在工作中学习，逐步将专家的指导转化为可复用的知识。通过结构化记忆和限制AI可执行操作的安全检查，这些系统随着时间推移能够变得更可靠，同时仍将关键决策保留给人类。作者强调，真正的全自动实验室还需要在校准、长期记忆管理以及处理仍依赖人类灵巧性和直觉的任务方面做更多工作。即便如此，这项工作指向了这样一个未来：科学家们将花更少时间与复杂控制系统纠缠，更多时间提出宏大的问题，让AI伙伴帮助运行那些把想法变为发现的仪器。

引用: Vriza, A., Prince, M.H., Zhou, T. et al. Operating advanced scientific instruments with AI agents that learn on the job. npj Comput Mater 12, 160 (2026). https://doi.org/10.1038/s41524-026-02005-0

关键词: 人工智能代理, 自动驾驶实验室, 科学仪器, 机器人实验, 多模态大语言模型