Clear Sky Science · es

Operar instrumentos científicos avanzados con agentes de IA que aprenden en el trabajo

· Volver al índice

Máquinas más inteligentes para la ciencia cotidiana

Las herramientas científicas modernas, desde potentes microscopios de rayos X hasta laboratorios de química manejados por robots, pueden recopilar datos más rápido que nunca. Pero manejar estas máquinas sigue exigiendo atención experta y una configuración cuidadosa, lo que limita quién puede usarlas y la velocidad a la que se producen los descubrimientos. Este artículo explora cómo una nueva generación de “agentes” de inteligencia artificial puede aprender junto a los científicos humanos para operar instrumentos complejos de forma más segura, flexible y eficiente.

Figure 1
Figure 1.

De pulsar botones a socios que aprenden

Los laboratorios avanzados de hoy automatizan muchos pasos rutinarios, pero la verdadera independencia—planificar experimentos, interpretar imágenes y decidir qué hacer después—sigue estando fuera de alcance. Los autores se basan en modelos de lenguaje de gran tamaño, el mismo tipo de IA que impulsa los chatbots modernos, y los convierten en agentes orientados a objetivos que pueden escribir código, invocar herramientas de software y reaccionar ante imágenes y vídeo. En lugar de reemplazar a los científicos, estos agentes están diseñados para trabajar con un “humano en el bucle”: las personas describen lo que quieren, aportan correcciones cuando es necesario, y la IA recuerda esas lecciones para usos futuros.

Un copiloto digital para un microscopio de rayos X

La primera bancada de pruebas es una línea de luz de nanobrocheo con rayos X duros, una máquina que utiliza rayos X focalizados para mapear la estructura de los materiales a escala de milmillonésimas de metro. Debido a los riesgos por radiación, nadie puede estar en la sala mientras funciona, y toda la configuración se controla mediante software y scripts especializados. El equipo conecta varios agentes de IA a este sistema de control. Un agente escribe los comandos necesarios para escanear una muestra; otro revisa el código por seguridad y corrección; un agente de visión analiza las imágenes resultantes para sugerir dónde acercarse con un zoom. Los agentes deben no solo traducir peticiones en lenguaje natural a comandos de escaneado correctos, sino también leer diminutos puntos brillantes en imágenes de difracción y fluorescencia y convertir sus ubicaciones en coordenadas precisas para nuevos escaneos.

Lo que la IA acertó — y dónde tuvo dificultades

Al comparar varios de los principales modelos de lenguaje con capacidad visual, los investigadores encuentran diferencias claras en el rendimiento. Algunos modelos son buenos siguiendo instrucciones textuales e invocando la función adecuada, especialmente después de que se les muestran ejemplos y reciben correcciones humanas. Otros son mucho mejores en razonamiento visual, como localizar partículas brillantes aisladas y evitar agrupamientos densos al elegir dónde escanear a continuación. El modelo destacado en este estudio combina ambas fortalezas y muestra el comportamiento más consistente a lo largo de ensayos repetidos. Sin embargo, los autores también hallan que dar retroalimentación mejora principalmente las habilidades basadas en texto, como la selección de parámetros; no repara de forma mágica una comprensión visual débil.

Figure 2
Figure 2.

Enseñar a los robots a ejecutar sus propios experimentos

La segunda bancada de pruebas es una estación automatizada para fabricar películas delgadas de polímero, usadas en dispositivos electrónicos y energéticos. Aquí, un brazo robótico equipado con distintos agarres mueve viales, sustratos, puntas de pipeta y una herramienta de recubrimiento por cuchilla entre varias estaciones. Los investigadores eliminan la mayor parte de las rutinas de alto nivel y dan a los agentes solo comandos de bajo nivel y un mapa de dónde está todo. La IA debe leer un artículo científico para extraer condiciones de recubrimiento adecuadas, planificar una larga cadena de pasos—como recoger un sustrato, colocarlo en el recubridor, destapar un vial, dispensar solución y extenderla bajo temperatura y velocidad controladas—y luego generar y verificar el código del robot para llevarlo a cabo. Los supervisores humanos aprueban cada nueva secuencia, y sus correcciones se almacenan en un sistema de memoria para que los agentes puedan reutilizar patrones exitosos más adelante.

Hacia laboratorios autónomos

Tanto en la línea de luz de rayos X como en la plataforma de fabricación robótica, el estudio muestra que los agentes de IA pueden aprender en el trabajo, convirtiendo gradualmente la guía experta en conocimiento reutilizable. Con una memoria estructurada y comprobaciones de seguridad que limitan lo que la IA puede hacer, estos sistemas pueden volverse más fiables con el tiempo mientras se dejan las decisiones críticas en manos humanas. Los autores enfatizan que los laboratorios totalmente automáticos exigirán más trabajo en calibración, gestión de memoria a largo plazo y en tareas que aún dependen de la destreza e intuición humanas. Aun así, este trabajo apunta a un futuro en el que los científicos dediquen menos tiempo a lidiar con controles complejos y más tiempo a plantear preguntas ambiciosas, mientras los socios de IA ayudan a manejar los instrumentos que convierten ideas en descubrimientos.

Cita: Vriza, A., Prince, M.H., Zhou, T. et al. Operating advanced scientific instruments with AI agents that learn on the job. npj Comput Mater 12, 160 (2026). https://doi.org/10.1038/s41524-026-02005-0

Palabras clave: agentes de IA, laboratorios autónomos, instrumentación científica, experimentos robóticos, modelos de lenguaje multimodales de gran tamaño