Clear Sky Science · es

Un modelo multimodal de lenguaje grande para la ciencia de materiales

2026-04-24 · Volver al índice

Por qué los nuevos materiales importan en la vida cotidiana

Desde baterías de teléfonos mejores hasta paneles solares más eficientes y ordenadores más rápidos, muchas de las tecnologías del mañana dependen de descubrir y perfeccionar nuevos materiales. Sin embargo, averiguar qué combinaciones de átomos producirán las propiedades adecuadas es como buscar agujas en un pajar de tamaño cósmico. Este artículo presenta MatterChat, un sistema de inteligencia artificial diseñado para conversar con los científicos en lenguaje cotidiano y al mismo tiempo “ver” la estructura atómica detallada de los materiales, ayudando a predecir cómo se comportan y cómo podrían sintetizarse en el laboratorio.

Un asistente digital que ve átomos y lee palabras

MatterChat está concebido para combinar dos tipos de información muy distintos: la disposición 3D precisa de los átomos en un sólido y las preguntas y el conocimiento basados en texto que usan los científicos. Por un lado, el sistema recibe una estructura cristalina, que puede representarse como una red de átomos y enlaces. La procesa mediante potentes modelos inspirados en la física que se han entrenado con cientos de miles de materiales conocidos para producir huellas numéricas compactas de cada átomo y su entorno. Por otro lado, un gran modelo de lenguaje —basado en el sistema de código abierto Mistral 7B— transforma la pregunta del usuario, por ejemplo sobre estabilidad o comportamiento electrónico, en su propia representación interna. Un módulo “puente” diseñado ad hoc aprende a alinear estos dos mundos para que el modelo de lenguaje pueda razonar directamente sobre lo que hacen los átomos.

Enseñar al sistema con un catálogo amplio de materiales

Para entrenar MatterChat, los autores recurrieron a una gran base de datos que contiene 142 899 materiales inorgánicos del Materials Project. Para cada material utilizaron no solo la estructura atómica completa, sino también doce tipos de información descriptiva. Estas abarcan desde identificadores básicos como la fórmula química, el tipo de simetría y la familia cristalina hasta nueve propiedades clave, incluyendo si el material es metálico o aislante, su brecha electrónica (bandgap), comportamiento magnético y varias medidas de estabilidad termodinámica. Al emparejar cada estructura con numerosas preguntas y respuestas en formato de texto sobre estas propiedades, el sistema aprendió a conectar patrones en los arreglos atómicos con las palabras que los científicos usan para describir y analizar materiales.

De búsquedas sencillas a razonamiento al estilo científico

Una vez entrenado, MatterChat puede hacer más que repetir entradas de la base de datos. Cuando un usuario proporciona una estructura, el sistema puede responder a una amplia gama de preguntas, como identificar la fórmula, estimar si el material debería existir en el laboratorio o calcular energías que normalmente requieren costosos cálculos cuántico-mecánicos. Los autores muestran ejemplos en los que MatterChat produce evaluaciones detalladas de materiales específicos, incluyendo comentarios sobre estabilidad, brechas electrónicas y magnetismo. En algunos casos va más allá, generando recetas de laboratorio plausibles paso a paso para fabricar compuestos bien conocidos como el nitruro de galio y la granate de hierro y itrio, aprovechando el conocimiento científico general almacenado en su modelo de lenguaje mientras fundamenta sus respuestas en la estructura cristalina suministrada.

Superando a chatbots de uso general en cifras difíciles

Un resultado llamativo es que MatterChat supera en predicción de propiedades cuantitativas tanto a modelos de lenguaje tradicionales como a varias herramientas de aprendizaje automático especializadas en física. En nueve tareas de referencia, es más preciso al decidir, por ejemplo, si un sólido es metálico, estable o magnético. Para magnitudes continuas como la energía de formación o la brecha electrónica, sus predicciones están más cerca de los valores obtenidos mediante exigentes simulaciones por ordenador. Esto se mantiene incluso cuando se evalúa con una colección separada de compuestos recién descubiertos del proyecto GNoME, que no se utilizaron durante el entrenamiento. Los autores también analizan las representaciones internas del sistema y muestran que estructuras similares tienden a agruparse y que los cambios en la estabilidad se representan de forma continua en este mapa interno, lo que indica que el modelo ha aprendido patrones químicamente significativos.

Qué podría significar esto para el descubrimiento de nuevos materiales

Para no especialistas, la conclusión principal es que MatterChat actúa como un interlocutor que comprende el lenguaje científico y tiene un sentido detallado de cómo se disponen los átomos en los sólidos. Al fusionar estas capacidades, puede responder con rapidez a preguntas que antes requerían intuición experta y cálculos costosos, y puede sugerir rutas de síntesis realistas para candidatos prometedores. Aunque los autores señalan que el sistema aún tiene dificultades con números extremadamente precisos y en ocasiones puede conjeturar con excesiva confianza, sostienen que su diseño modular y su sólido rendimiento marcan un paso importante hacia herramientas de IA que ayudan a los científicos a navegar el vasto espacio de materiales posibles, acelerando el camino de las ideas a las tecnologías funcionales.

Cita: Tang, Y., Xu, W., Cao, J. et al. A multimodal large language model for materials science. Nat Mach Intell 8, 588–601 (2026). https://doi.org/10.1038/s42256-026-01214-y

Palabras clave: descubrimiento de materiales, IA multimodal, estructuras cristalinas, predicción de propiedades, chatbots científicos