Clear Sky Science · pt
Operando instrumentos científicos avançados com agentes de IA que aprendem no trabalho
Máquinas mais inteligentes para a ciência do dia a dia
Ferramentas científicas modernas, desde poderosos microscópios de raios X até laboratórios de química operados por robôs, podem coletar dados mais rápido do que nunca. Mas operar essas máquinas ainda exige atenção de especialistas e configuração cuidadosa, o que limita quem pode usá-las e a velocidade com que as descobertas são feitas. Este artigo explora como uma nova geração de “agentes” de inteligência artificial pode aprender ao lado de cientistas humanos para operar instrumentos complexos de forma mais segura, flexível e eficiente.

Do apertar de botões a parceiros que aprendem
Os laboratórios avançados de hoje automatizam muitas etapas rotineiras, mas a verdadeira independência — planejar experimentos, interpretar imagens e decidir o que fazer a seguir — continua fora de alcance. Os autores partem de modelos de linguagem grande, o mesmo tipo de IA que alimenta chatbots modernos, e os transformam em agentes orientados a objetivos que podem escrever código, chamar ferramentas de software e reagir a imagens e vídeos. Em vez de substituir os cientistas, esses agentes são projetados para trabalhar em um formato de “humano no circuito”: as pessoas descrevem o que querem, fornecem correções quando necessário, e a IA lembra essas lições para uso futuro.
Um co-piloto digital para um microscópio de raios X
O primeiro campo de prova é uma linha de feixe de nanoprobe de raios X duros, uma máquina que usa raios X focados para mapear a estrutura de materiais na escala de bilionésimos de metro. Por causa dos riscos de radiação, ninguém pode estar na sala enquanto ela opera, e toda a configuração é controlada por software e scripts especializados. A equipe conecta vários agentes de IA a esse sistema de controle. Um agente escreve os comandos necessários para escanear uma amostra; outro revisa o código quanto à segurança e correção; um agente de visão analisa as imagens resultantes para sugerir onde ampliar para um exame mais detalhado. Os agentes não apenas precisam traduzir pedidos em linguagem natural em comandos de varredura corretos, mas também ler pontinhos brilhantes minúsculos em imagens de difração e fluorescência e transformar suas localizações em coordenadas precisas para novos scans.
O que a IA acertou — e onde teve dificuldades
Ao comparar vários modelos de linguagem com capacidade visual, os pesquisadores encontram diferenças claras de desempenho. Alguns modelos são bons em seguir instruções textuais e chamar a função certa, especialmente depois de receberem exemplos e correções humanas. Outros são muito melhores em raciocínio visual, como localizar partículas brilhantes isoladas e evitar aglomerados quando escolhem onde escanear a seguir. O modelo de destaque neste estudo combina ambas as fortalezas e mostra o comportamento mais consistente ao longo de ensaios repetidos. No entanto, os autores também constatam que fornecer feedback melhora principalmente habilidades baseadas em texto, como seleção de parâmetros; isso não corrige magicamente uma compreensão visual fraca.

Ensinando robôs a conduzir seus próprios experimentos
O segundo campo de prova é uma estação automatizada para fabricar filmes poliméricos finos, usados em eletrônica e dispositivos de energia. Aqui, um braço robótico equipado com diferentes garras move frascos, substratos, ponteiras de pipeta e uma ferramenta de revestimento por lâmina entre várias estações. Os pesquisadores retiram a maioria das rotinas de alto nível e dão aos agentes apenas comandos de baixo nível e um mapa de onde tudo está. A IA deve ler um artigo científico para extrair condições de revestimento adequadas, planejar uma longa cadeia de passos — como pegar um substrato, colocá-lo no revestidor, destampar um frasco, dispensar a solução e espalhá-la sob temperatura e velocidade controladas — e então gerar e verificar o código do robô para executar isso. Supervisores humanos aprovam cada nova sequência, e suas correções são armazenadas em um sistema de memória para que os agentes possam reutilizar padrões bem-sucedidos posteriormente.
Construindo em direção a laboratórios autônomos
Tanto na linha de feixe de raios X quanto na plataforma de fabricação robótica, o estudo mostra que agentes de IA podem aprender no trabalho, transformando gradualmente a orientação de especialistas em conhecimento reutilizável. Com uma memória estruturada e checagens de segurança que limitam o que a IA pode fazer, esses sistemas podem se tornar mais confiáveis ao longo do tempo, mantendo ainda as decisões críticas nas mãos humanas. Os autores enfatizam que laboratórios totalmente automáticos requererão mais trabalho em calibração, gestão de memória de longo prazo e no tratamento de tarefas que ainda dependem da destreza e intuição humanas. Mesmo assim, este trabalho aponta para um futuro em que cientistas gastam menos tempo lutando com controles complexos e mais tempo fazendo perguntas ambiciosas, enquanto parceiros de IA ajudam a operar os instrumentos que transformam ideias em descobertas.
Citação: Vriza, A., Prince, M.H., Zhou, T. et al. Operating advanced scientific instruments with AI agents that learn on the job. npj Comput Mater 12, 160 (2026). https://doi.org/10.1038/s41524-026-02005-0
Palavras-chave: agentes de IA, laboratórios autônomos, instrumentação científica, experimentos robóticos, modelos de linguagem grande multimodais