Clear Sky Science · pt
DeepRetro descobre vias retrosintéticas por meio de raciocínio iterativo com grandes modelos de linguagem
Por que Química Mais Inteligente Importa
Muitos dos medicamentos e materiais mais importantes de hoje começam como moléculas intrincadas e difíceis de sintetizar. Planejar como construir essas moléculas no laboratório é um pouco como descobrir a melhor forma de desmontar e depois reconstruir uma máquina elaborada a partir de peças sobressalentes. Essa etapa de planejamento, chamada desenho de síntese, costuma ser um gargalo importante na descoberta de fármacos e em materiais avançados. Este artigo apresenta o DeepRetro, um novo sistema de código aberto que usa grandes modelos de linguagem — a mesma classe de IA por trás dos chatbots modernos — juntamente com softwares tradicionais de química e expertise humana para projetar receitas passo a passo realistas para produzir moléculas muito complexas.

Quebrando Moléculas Grandes em Pedaços Administráveis
Químicos geralmente planejam uma síntese trabalhando de forma retroativa a partir da molécula alvo, “quebrando” mentalmente a estrutura em fragmentos mais simples que podem ser comprados ou sintetizados. Computadores ajudam nessa tarefa há décadas, mas as ferramentas existentes têm dificuldade quando as moléculas ficam muito emaranhadas, exóticas ou diferentes de tudo que consta em suas bases de reações. O DeepRetro enfrenta isso combinando dois mundos: motores rápidos baseados em regras que aplicam padrões de reação conhecidos e um “cérebro” de modelo de linguagem capaz de sugerir formas incomuns, mas quimicamente plausíveis, de desconectar uma molécula. Em vez de pedir à IA que imagine uma receita completa de uma vez, o DeepRetro solicita apenas um passo retroativo por vez e então verifica cada sugestão cuidadosamente.
Mantendo a IA Responsável
Um problema central com grandes modelos de linguagem é que eles podem “alucinar” — isto é, propor com confiança passos que violam princípios básicos da química. O DeepRetro envolve a IA em várias camadas de checagem automática. Cada molécula intermediária proposta é testada quanto à correção simples (por exemplo, se os átomos têm o número adequado de ligações), quanto à estabilidade provável e quanto à consistência interna com o restante da reação. Sugestões que falham nesses testes são rejeitadas. Para as que passam, o sistema então chama um mecanismo de busca mais tradicional para verificar se a química conhecida pode conectar esses blocos de construção de volta a matérias-primas reais e compráveis. Químicos também podem intervir em qualquer ponto por meio de uma interface gráfica: editar estruturas, reexecutar apenas uma parte de uma via ou adicionar grupos protetores comuns que tornam a química multietapa prática.

Testando o Sistema
Para avaliar o desempenho do DeepRetro, os autores o testaram em coleções-padrão de reações extraídas de bases de patentes. Para previsões de um único passo — adivinhar quais reagentes poderiam produzir um determinado produto — o sistema igualou ou superou ferramentas existentes fortes em várias métricas, especialmente ao identificar corretamente o precursor principal mesmo quando ingredientes secundários diferiam. Para o planejamento em múltiplas etapas, o DeepRetro resolveu quase todos os alvos em dois conjuntos de teste exigentes, incluindo uma coleção de moléculas difíceis, com semelhança a fármacos, superando métodos anteriores de ponta. Importante: esses testes foram executados em modo totalmente automático, sem correções humanas, demonstrando que a arquitetura é robusta mesmo antes da intervenção de químicos especialistas.
Casos Reais
Benchmarks isolados podem deixar passar o que os químicos realmente valorizam: uma rota proposta parece algo que um praticante habilidoso tentaria no laboratório? Os autores, portanto, estudaram cinco famosos e altamente complexos produtos naturais, incluindo os antibióticos eritromicina B e discodermolida, e o alcaloide reserpina. Em cada caso, o DeepRetro trabalhou ao lado de químicos humanos em um ciclo iterativo. A IA sugeriu desconexões e fragmentos de rota; os químicos eliminaram ideias duvidosas, corrigiram questões estereoquímicas sutis e, ocasionalmente, orientaram o sistema com um intermediário chave. Em dois casos, o DeepRetro produziu planos sintéticos completos cuja estratégia global não correspondia a nada que os autores encontraram na literatura, embora as reações individuais fossem conhecidas. Isso sugere que o sistema pode recombinar química familiar em rotas globais genuinamente novas.
Promessa, Limites e Próximos Passos
O DeepRetro demonstra que grandes modelos de linguagem podem ser mais do que geradores de texto inteligentes; quando rigidamente supervisionados e combinados com ferramentas estabelecidas, eles podem ajudar a navegar o enorme espaço de busca de possíveis sínteses químicas. A estrutura ainda tem limites: modelos de linguagem de uso geral frequentemente propõem intermediários instáveis ou irrealistas, e soluções totalmente automáticas para as moléculas mais difíceis permanecem fora de alcance sem supervisão humana. Não obstante, o forte desempenho do DeepRetro em testes padrão, seu sucesso em estudos de caso desafiadores e seu lançamento como software de código aberto o tornam um modelo prático para futuras descobertas científicas assistidas por IA. Para não especialistas, a conclusão é que a IA está avançando de uma mera previsão de propriedades moleculares para o co-projeto de receitas de laboratório inteiras, com potencial para acelerar a criação de fármacos e materiais nos próximos anos.
Citação: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z
Palavras-chave: retrossíntese, grandes modelos de linguagem, planejamento de síntese orgânica, descoberta de fármacos, química computacional