Clear Sky Science · es
MOFMeld: un marco de fusión estructura–lenguaje para la predicción de propiedades de MOF en la captura de carbono
Por qué importan materiales más inteligentes para limpiar el aire
Reducir los gases de efecto invernadero como el dióxido de carbono es esencial para frenar el calentamiento global, pero capturar CO2 de forma eficiente del aire y de los gases industriales sigue siendo muy difícil. Una clase prometedora de cristales porosos llamados marcos metal–orgánicos (MOF) puede absorber CO2 como esponjas, sin embargo solo una fracción diminuta de los MOF posibles ha sido probada. Este artículo presenta MOFMeld, un nuevo sistema de inteligencia artificial que ayuda a los científicos a buscar entre vastos números de candidatos MOF de forma más rápida y transparente combinando lo que sabemos de mediciones de laboratorio, modelos por ordenador y la literatura científica.

Del reto climático a la búsqueda de materiales
Las tecnologías de captura de carbono, incluidas las plantas de captura directa de aire, dependen de materiales especiales que puedan captar fuertemente el CO2, liberarlo de nuevo con poca energía y sobrevivir a usos repetidos en condiciones húmedas del mundo real. Los MOF resultan atractivos porque sus bloques constructores se pueden combinar para ajustar el tamaño de poro, el área superficial y la química. Sin embargo, ensayar cada diseño experimentalmente o con costosas simulaciones informáticas es lento y caro. La mayoría de los datos disponibles están dispersos en miles de artículos, a menudo enterrados en texto y figuras en lugar de en bases de datos ordenadas. Como resultado, gran parte de nuestro conocimiento arduamente conseguido sobre qué MOF funcionan bien —y por qué— permanece infrautilizado.
Fusionando la estructura con el lenguaje científico
MOFMeld aborda este problema uniendo dos tipos de fortalezas de la IA. Por un lado, utiliza un modelo de lenguaje grande, llamado MOFLLaMA, que ha sido entrenado especialmente con alrededor de 1.500 artículos sobre MOF–CO2 y más de 20.000 pares de pregunta–respuesta extraídos de ellos. Este modelo de lenguaje se conecta además con un «grafo de conocimiento» que vincula los MOF con propiedades experimentales reportadas y detalles de síntesis, de modo que sus respuestas pueden rastrearse hasta las fuentes en vez de ser conjeturas. Por otro lado, MOFMeld emplea una red neuronal basada en grafos que lee la disposición atómica tridimensional real de un cristal de MOF, convirtiendo su red de poros y conectividad en una huella numérica compacta. Un módulo «puente» ligero conecta luego estas huellas con el modelo de lenguaje para que el sistema pueda responder preguntas y hacer predicciones teniendo en cuenta la estructura cristalina real.
Prediciendo cuán bien los MOF capturan carbono
Los autores evaluaron MOFMeld en una gran colección de MOF hipotéticos con propiedades calculadas por ordenador conocidas. Se pidió al sistema que predijera seis magnitudes importantes: dos medidas del tamaño de poro, el área superficial total, cuánto espacio vacío contiene el sólido y la captación de CO2 tanto a presiones moderadas como muy bajas. Aunque MOFMeld fue entrenado con solo unas 30.000 estructuras —mucho menos que los modelos tradicionales basados solo en grafos— igualó o superó a redes neuronales sólidas de solo estructura en la mayoría de los objetivos. En particular, fue muy preciso para rasgos geométricos como tamaños de poro y porosidad, y destacó en la predicción de captura de CO2 a baja presión, donde el rendimiento depende de sitios de unión químicos sutiles más que del simple volumen de poro total.

Pruebas con materiales del mundo real y una mirada al interior del modelo
Para ver cómo se comporta MOFMeld más allá de las estructuras simuladas, el equipo lo aplicó a miles de MOF reportados experimentalmente procedentes de una base de datos curada. El sistema clasificó candidatos por la captación de CO2 predicha, y cuando el grupo superior se verificó con simulaciones detalladas, muchos mostraron de hecho una alta capacidad de captura. Aunque los errores numéricos fueron mayores que en el conjunto de prueba puramente hipotético —reflejando la química más amplia y desordenada de los MOF del mundo real—, la herramienta aún dirigió la atención hacia materiales prometedores. Los autores también visualizaron las representaciones internas aprendidas por el módulo puente. Los MOF con porosidad similar se agruparon de manera coherente, y cuando se alteraron las señales estructurales que alimentan al modelo de lenguaje, la calidad de la predicción cayó. Esto sugiere que el modelo realmente depende de indicios estructurales significativos en lugar de limitarse a memorizar patrones de texto.
Qué significa esto para la futura captura de carbono
En términos cotidianos, MOFMeld actúa como un asistente de investigación especializado que no solo lee la literatura sobre MOF sino que también «ve» la arquitectura interna de cada cristal, y después combina ambas perspectivas para estimar cuán bien un material retendrá CO2. Al ser preciso, relativamente eficiente en datos e interpretable, ofrece una forma escalable de enfocar experimentos y simulaciones más caras en los candidatos más prometedores. Si bien se necesita trabajo adicional para manejar mejor la plena diversidad de MOF reales y consultas de usuario más naturales, el marco apunta hacia herramientas más inteligentes y conscientes de la literatura que pueden acelerar el descubrimiento de materiales avanzados para la captura de carbono y, en última instancia, ayudar a llevar tecnologías más limpias al mercado con mayor rapidez.
Cita: You, H., Zhang, S., Du, L. et al. MOFMeld: a structure–language fusion framework for MOF property prediction in carbon capture. npj Artif. Intell. 2, 47 (2026). https://doi.org/10.1038/s44387-026-00106-1
Palabras clave: materiales para captura de carbono, marcos metal–orgánicos, aprendizaje automático para materiales, modelos de lenguaje grande, fusión estructura–lenguaje