Clear Sky Science · nl

DeepRetro ontdekt retrosynthetische routes via iteratief redeneren met grote taalmodellen

· Terug naar het overzicht

Waarom slimere chemie ertoe doet

Veel van de belangrijkste geneesmiddelen en materialen van vandaag beginnen als ingewikkelde, moeilijk te maken moleculen. Het plannen van hoe je deze moleculen in het laboratorium bouwt, lijkt op het uitzoeken van de beste manier om een complex apparaat te demonteren en vervolgens opnieuw op te bouwen uit reserveonderdelen. Die planningsstap, synthesearchitectuur genoemd, is vaak een belangrijke knelpunt voor medicijnontwikkeling en geavanceerde materialen. Dit artikel introduceert DeepRetro, een nieuw open-source systeem dat grote taalmodellen—dezelfde klasse AI achter moderne chatbots—combineert met traditionele chemiesoftware en menselijke expertise om realistische stap-voor-stap recepten te ontwerpen voor het maken van zeer complexe moleculen.

Figure 1
Figure 1.

Grote moleculen in beheersbare stukken verdelen

Schemisten plannen een synthese doorgaans door achteruit van het doelmolecuul te werken en het mentaal ‘los te klikken’ in eenvoudigere onderdelen die gekocht of gemaakt kunnen worden. Computers helpen al decennia bij deze taak, maar bestaande hulpmiddelen hebben moeite zodra moleculen te verward, exotisch of anders dan alles in hun reactiedatabases worden. DeepRetro pakt dit aan door twee werelden te combineren: snelle, regelgebaseerde engines die bekende reactiepatronen toepassen, en een taalmodel-brein dat ongewone maar chemisch zinvolle manieren kan voorstellen om een molecuul uiteen te halen. In plaats van de AI in één keer een volledig recept te laten verzinnen, vraagt DeepRetro slechts om één terugwaartse stap tegelijk en controleert vervolgens elke suggestie zorgvuldig.

De AI eerlijk houden

Een belangrijk probleem met grote taalmodellen is dat ze kunnen ‘hallucineren’—ze doen soms zelfverzekerd voorstellen die de basisprincipes van de chemie schenden. DeepRetro omringt de AI met meerdere lagen van geautomatiseerde controles. Elk voorgesteld intermediair wordt getest op eenvoudige correctheid (bijvoorbeeld of atomen het juiste aantal bindingen hebben), op waarschijnlijke stabiliteit en op interne consistentie met de rest van de reactie. Suggesties die deze tests niet doorstaan worden afgewezen. Voor degenen die slagen, roept het systeem vervolgens een meer traditionele zoekmotor aan om te controleren of bekende chemie deze bouwstenen kan verbinden met echte, koopbare uitgangsmaterialen. Chemici kunnen ook op elk moment ingrijpen via een grafische interface: zij kunnen structuren bewerken, slechts een deel van een route opnieuw berekenen of gebruikelijke beschermgroepen toevoegen die meerstapschemie praktisch maken.

Figure 2
Figure 2.

Het systeem op de proef stellen

Om te beoordelen hoe goed DeepRetro werkt, evalueerden de auteurs het op standaard benchmarkverzamelingen van reacties uit octrooidatabanken. Voor eénstapsvoorspellingen—het raden welke reagentia een bepaald product kunnen vormen—overtrof of evenaarde het systeem sterke bestaande tools op verschillende maatstaven, vooral in het correct identificeren van de belangrijkste precursor zelfs wanneer secundaire ingrediënten verschilden. Voor meerstapsplanning loste DeepRetro bijna alle doelen op in twee veeleisende testsets, inclusief een verzameling van bijzonder lastige, medicijnachtige moleculen, en presteerde het beter dan eerdere state-of-the-art methoden. Belangrijk is dat deze tests in volledig automatische modus werden uitgevoerd, zonder menselijke correcties, wat aantoont dat het raamwerk robuust is nog voordat deskundige chemici ingrijpen.

Praktijkgevallen uit de echte wereld

Benchmarks alleen kunnen missen waar chemici echt om geven: ziet een voorgestelde route eruit als iets dat een vaardige practicus daadwerkelijk in het lab zou proberen? De auteurs onderzochten daarom vijf beroemde, zeer complexe natuurlijke producten, waaronder de antibiotica erythromycine B en discodermolide, en het alkaloïde reserpine. Voor elk geval werkte DeepRetro samen met menselijke chemici in een iteratieve cyclus. De AI suggereerde ontkoppelingen en routefragmenten; chemici snoeiden twijfelachtige ideeën weg, corrigeerden subtiele stereochemische problemen en gaven het systeem af en toe een duwtje met een belangrijk intermediair. In twee gevallen leverde DeepRetro volledige syntheseplannen op waarvan de algemene strategie nergens in de literatuur terug te vinden was, hoewel de afzonderlijke reacties bekend waren. Dit suggereert dat het systeem vertrouwde chemie kan hercombineren tot werkelijk nieuwe globale routes.

Belofte, beperkingen en wat volgt

DeepRetro laat zien dat grote taalmodellen meer kunnen zijn dan slimme tekstgeneratoren; wanneer ze strak worden gecontroleerd en gecombineerd met gevestigde hulpmiddelen, kunnen ze helpen navigeren door de enorme zoekruimte van mogelijke chemische synthesen. Het raamwerk heeft nog steeds beperkingen: algemene taalmodellen stellen vaak onstabiele of onrealistische intermediairen voor, en volledig automatische oplossingen voor de allermoeilijkste moleculen blijven onbereikbaar zonder menselijk toezicht. Niettemin maken DeepRetro’s sterke prestaties op standaardtests, het succes in uitdagende casestudies en de open-source vrijgave het tot een praktisch sjabloon voor toekomstige AI-ondersteunde wetenschappelijke ontdekkingen. Voor niet-specialisten is de conclusie dat AI opschuift van louter het voorspellen van moleculaire eigenschappen naar het co-ontwerpen van geheel nieuwe laboratoriumrecepten, met het potentieel om de ontwikkeling van geneesmiddelen en materialen in de komende jaren te versnellen.

Bronvermelding: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z

Trefwoorden: retrosynthese, grote taalmodellen, plannen van organische synthese, medicijnontwikkeling, computationele chemie