Clear Sky Science · ru

Управление сложными научными приборами с помощью ИИ‑агентов, которые учатся в процессе работы

· Назад к списку

Более умные машины для повседневной науки

Современные научные инструменты — от мощных рентгеновских микроскопов до роботизированных химических лабораторий — могут собирать данные быстрее, чем когда‑либо. Но управление этими приборами по‑прежнему требует внимания экспертов и тщательной настройки, что ограничивает круг пользователей и скорость получения открытий. В этой работе рассматривается, как новое поколение искусственного интеллекта в виде «агентов», обучающихся вместе с людьми‑учеными, может управлять сложными приборами более безопасно, гибко и эффективно.

Figure 1
Figure 1.

От нажатия кнопок к партнёрству в обучении

Современные продвинутые лаборатории автоматизируют многие рутинные шаги, но настоящая автономность — планирование экспериментов, интерпретация изображений и принятие решений о дальнейших действиях — остаётся недостижимой. Авторы опираются на большие языковые модели, тот же тип ИИ, что лежит в основе современных чат‑ботов, и превращают их в агенты, ориентированные на цель: они умеют писать код, вызывать программные инструменты и реагировать на изображения и видео. Вместо того чтобы заменять учёных, эти агенты разработаны для работы в режиме «человек в петле»: люди описывают желаемое, при необходимости вносят правки, и ИИ запоминает эти уроки для будущего использования.

Цифровой сопилот для рентгеновского микроскопа

Первой испытательной платформой стала нанозондовая рентгеновская линия жесткого диапазона, прибор, использующий сфокусированные рентгеновские лучи для картирования структуры материалов на масштабе миллиардных долей метра. Из‑за радиационной опасности в комнате никого не может быть во время работы, и вся установка управляется специализированным ПО и скриптами. Команда подключает к системе управления несколько ИИ‑агентов. Один агент пишет команды, необходимые для сканирования образца; другой проверяет код на безопасность и корректность; визуальный агент анализирует полученные изображения и предлагает, где увеличить масштаб для более детального изучения. Агентам нужно не только переводить запросы на простом языке в правильные команды сканирования, но и распознавать крошечные яркие точки на дифракционных и флуоресцентных изображениях и превращать их положения в точные координаты для новых сканов.

Что ИИ сделал правильно — и где испытывал трудности

Сравнив несколько ведущих языковых моделей с визуальными возможностями, исследователи обнаружили заметные различия в производительности. Некоторые модели хорошо следуют текстовым инструкциям и вызывают нужные функции, особенно после того, как им показывают примеры и люди вносят исправления. Другие гораздо лучше справляются с визуальным рассуждением, например точно выявляют изолированные яркие частицы и избегают плотных скоплений при выборе следующей области сканирования. Лучшим в этом исследовании оказался модельный подход, комбинирующий оба эти преимущества и демонстрирующий наиболее стабильное поведение при повторных испытаниях. Однако авторы также отмечают, что обратная связь в основном улучшает навыки работы с текстом, такие как выбор параметров; она не волшебным образом исправляет слабое визуальное понимание.

Figure 2
Figure 2.

Обучение роботов проведению собственных экспериментов

Второй испытательный стенд — автоматизированная установка для изготовления тонких полимерных пленок, используемых в электронике и энергетических устройствах. Здесь роботизированная рука с разными захватами перемещает флаконы, подложки, наконечники пипеток и инструмент для нанесения лезвием между различными станциями. Исследователи убирают большинство высокоуровневых процедур и дают агентам лишь низкоуровневые команды и карту расположения всего оборудования. ИИ должен прочитать научную статью, чтобы извлечь подходящие условия нанесения покрытия, спланировать длинную цепочку шагов — например, захватить подложку, поместить её в покрывной модуль, снять крышку с флакона, дозировать раствор и разровнять его при контролируемой температуре и скорости — и затем сгенерировать и проверить код робота для выполнения этих действий. Человеческие руководители одобряют каждую новую последовательность, а их исправления сохраняются в системе памяти, чтобы агенты могли повторно использовать успешные шаблоны в будущем.

Движение в сторону самоуправляемых лабораторий

На примерах и рентгеновской линии, и платформы роботизированного изготовления исследование показывает, что ИИ‑агенты могут учиться в процессе работы, постепенно превращая экспертные указания в повторно применимые знания. При наличии структурированной памяти и проверок безопасности, ограничивающих полномочия ИИ, такие системы со временем могут становиться более надёжными, при этом критические решения остаются за людьми. Авторы подчёркивают, что для создания полностью автоматических лабораторий потребуется дополнительная работа по калибровке, управлению долговременной памятью и выполнению задач, которые по‑прежнему зависят от человеческой ловкости и интуиции. Тем не менее эта работа указывает на будущее, в котором учёные тратят меньше времени на борьбу со сложными системами управления и больше — на постановку смелых вопросов, пока ИИ‑партнёры помогают запускать приборы, превращающие идеи в открытия.

Цитирование: Vriza, A., Prince, M.H., Zhou, T. et al. Operating advanced scientific instruments with AI agents that learn on the job. npj Comput Mater 12, 160 (2026). https://doi.org/10.1038/s41524-026-02005-0

Ключевые слова: ИИ‑агенты, самоуправляемые лаборатории, научная аппаратура, роботизированные эксперименты, мультимодальные большие языковые модели