Clear Sky Science · es

DeepRetro descubre vías retrosintéticas mediante razonamiento iterativo con modelos de lenguaje a gran escala

· Volver al índice

Por qué importa una química más inteligente

Muchos de los medicamentos y materiales más importantes de hoy comienzan como moléculas intrincadas y difíciles de sintetizar. Planificar cómo construir esas moléculas en el laboratorio es algo así como averiguar la mejor forma de desmontar y luego reconstruir una máquina compleja a partir de piezas. Ese paso de planificación, llamado diseño de síntesis, suele ser un cuello de botella importante en el descubrimiento de fármacos y en materiales avanzados. Este artículo presenta DeepRetro, un nuevo sistema de código abierto que utiliza modelos de lenguaje a gran escala—la misma clase de IA detrás de los chatbots modernos—junto con software químico tradicional y la experiencia humana para diseñar recetas realistas, paso a paso, para fabricar moléculas muy complejas.

Figure 1
Figure 1.

Romper moléculas grandes en piezas manejables

Los químicos suelen planificar una síntesis trabajando hacia atrás desde la molécula objetivo, “desencajándola” mentalmente en piezas más simples que se pueden comprar o fabricar. Los ordenadores llevan ayudando en esta tarea durante décadas, pero las herramientas existentes tropiezan cuando las moléculas se vuelven demasiado enmarañadas, exóticas o distintas a todo lo que hay en sus bases de datos de reacciones. DeepRetro aborda esto combinando dos mundos: motores rápidos basados en reglas que aplican patrones de reacción conocidos, y un «cerebro» basado en modelos de lenguaje que puede sugerir formas inusuales pero químicamente sensatas de fragmentar una molécula. En lugar de pedir a la IA que imagine una receta completa de una vez, DeepRetro le solicita sólo un paso hacia atrás a la vez y luego verifica cada sugerencia con cuidado.

Mantener a la IA honesta

Un problema clave con los modelos de lenguaje a gran escala es que pueden “alucinar”: pueden proponer con confianza pasos que violan principios químicos básicos. DeepRetro envuelve a la IA en varias capas de comprobación automática. Cada molécula intermedia propuesta se somete a tests de corrección simple (por ejemplo, si los átomos tienen el número correcto de enlaces), de probabilidad de estabilidad y de coherencia interna con el resto de la reacción. Las sugerencias que fallan estas pruebas se descartan. Para las que pasan, el sistema llama a un motor de búsqueda más tradicional para ver si la química conocida puede conectar esos bloques hasta materiales de partida reales y comprables. Los químicos también pueden intervenir en cualquier momento a través de una interfaz gráfica: pueden editar estructuras, volver a ejecutar sólo una parte de una vía o añadir grupos protectores comunes que hacen práctica la química en varios pasos.

Figure 2
Figure 2.

Poner el sistema a prueba

Para evaluar qué tan bien funciona DeepRetro, los autores lo probaron en colecciones de referencia estándar de reacciones extraídas de bases de datos de patentes. Para predicciones de un solo paso—adivinar qué reactivos podrían generar un producto dado—el sistema igualó o superó a herramientas sólidas existentes en varias medidas, especialmente en identificar correctamente el precursor principal incluso cuando los ingredientes menores diferían. Para la planificación de múltiples pasos, DeepRetro resolvió casi todos los objetivos en dos conjuntos de prueba exigentes, incluida una colección de moléculas con carácter farmacéutico particularmente complicadas, superando a métodos previos de última generación. Es importante destacar que estas pruebas se realizaron en modo completamente automático, sin correcciones humanas, lo que demuestra que el marco es robusto incluso antes de la intervención de químicos expertos.

Casos reales

Los benchmarks por sí solos pueden pasar por alto lo que realmente importa a los químicos: ¿parece una vía propuesta algo que un practicante cualificado realmente intentaría en el laboratorio? Por ello, los autores estudiaron cinco productos naturales famosos y altamente complejos, incluidos los antibióticos eritromicina B y discodermólida, y el alcaloide reserpina. Para cada caso, DeepRetro trabajó junto a químicos humanos en un bucle iterativo. La IA sugirió desconexiones y fragmentos de rutas; los químicos podaron ideas dudosas, corrigieron sutiles problemas estereoquímicos y, ocasionalmente, impulsaron el sistema con un intermedio clave. En dos casos, DeepRetro produjo planes sintéticos completos cuya estrategia global no coincidía con nada que los autores encontraran en la literatura, aunque las reacciones individuales eran conocidas. Esto sugiere que el sistema puede recombinar quimica familiar en rutas globales genuinamente nuevas.

Promesas, límites y siguientes pasos

DeepRetro muestra que los modelos de lenguaje a gran escala pueden ser más que generadores ingeniosos de texto; cuando se supervisan estrechamente y se combinan con herramientas establecidas, pueden ayudar a navegar el enorme espacio de búsqueda de posibles síntesis químicas. El marco aún tiene límites: los modelos de lenguaje de propósito general a menudo proponen intermedios inestables o poco realistas, y las soluciones totalmente automáticas para las moléculas más difíciles siguen estando fuera de alcance sin supervisión humana. No obstante, el sólido rendimiento de DeepRetro en pruebas estándar, su éxito en estudios de casos desafiantes y su lanzamiento como código abierto lo convierten en un modelo práctico para futuros descubrimientos científicos asistidos por IA. Para los no especialistas, la conclusión es que la IA está pasando de predecir meramente propiedades moleculares a co-diseñar recetas de laboratorio completamente nuevas, con el potencial de acelerar la creación de fármacos y materiales en los próximos años.

Cita: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z

Palabras clave: retrosíntesis, modelos de lenguaje a gran escala, planificación de síntesis orgánica, descubrimiento de fármacos, química computacional