Clear Sky Science · sv
DeepRetro upptäcker retrosyntetiska vägar genom iterativ resonemang med stora språkmodeller
Varför smartare kemi spelar roll
Många av dagens viktigaste läkemedel och material börjar som intrikata, svårframställda molekyler. Att planera hur man bygger dessa molekyler i laboratoriet liknar att lista ut det bästa sättet att plocka isär och sedan bygga upp en komplicerad maskin från reservdelar. Denna planeringsfas, som kallas syntesdesign, är ofta en stor flaskhals för läkemedelsutveckling och avancerade material. I denna artikel presenteras DeepRetro, ett nytt öppen-källkodssystem som använder stora språkmodeller—samma klass av AI som ligger bakom moderna chattbotar—tillsammans med traditionell kemiprogramvara och mänsklig expertis för att utforma realistiska steg-för-steg-recept för att framställa mycket komplexa molekyler.

Bryta ner stora molekyler i hanterbara delar
Kemister planerar vanligtvis en syntes genom att arbeta baklänges från målmolekylen och mentalt ”bryta” den i enklare delar som kan köpas eller tillverkas. Datorer har hjälpt till med den här uppgiften i årtionden, men befintliga verktyg får problem när molekyler blir för intrasslade, exotiska eller olik allt i deras reaktionsdatabaser. DeepRetro tar sig an detta genom att kombinera två världar: snabba, regelbaserade motorer som tillämpar kända reaktionsmönster, och en språkmodell som kan föreslå ovanliga men kemiskt rimliga sätt att dela en molekyl. Istället för att be AI:n hitta ett helt recept på en gång ber DeepRetro den om endast ett bakåtsteg i taget och kontrollerar sedan varje förslag noggrant.
Hålla AI:n ärlig
Ett centralt problem med stora språkmodeller är att de kan ”hallucinera”–de kan självsäkert föreslå steg som bryter mot grundläggande kemiska principer. DeepRetro omsluter AI:n i flera lager av automatiska kontroller. Varje föreslagen intermediärmolekyl testas för enkel korrekthet (till exempel att atomer har rätt antal bindningar), för trolig stabilitet och för intern konsistens med resten av reaktionen. Förslag som misslyckas med dessa tester avvisas. För dem som passerar anropar systemet sedan en mer traditionell sökmotor för att se om känd kemi kan koppla dessa byggstenar tillbaka till verkliga, köpbara startmaterial. Kemister kan också ingripa när som helst via ett grafiskt gränssnitt: de kan redigera strukturer, köra om endast en del av en väg eller lägga till vanliga skyddsgrupper som gör flerstegs-kemi praktisk.

Sätta systemet på prov
För att undersöka hur väl DeepRetro fungerar utvärderade författarna det på standardiserade referenssamlingar av reaktioner från patentdatabaser. För enstegsförutsägelser—att gissa vilka reaktanter som kan ge en viss produkt—matchade eller överträffade systemet starka befintliga verktyg i flera mått, särskilt när det gällde att korrekt identifiera huvudprekursor även när mindre ingredienser skiljde sig. För flerstegsplanering löste DeepRetro nästan alla mål i två krävande testuppsättningar, inklusive en samling särskilt knepiga läkemedelslika molekyler, och överträffade tidigare toppmetoder. Viktigt är att dessa tester kördes i ett helt automatiskt läge, utan mänskliga korrigeringar, vilket visar att ramverket är robust även innan expertkemister kliver in.
Fallstudier från verkligheten
Endast benchmark-tester kan missa det som kemister verkligen bryr sig om: ser en föreslagen väg ut som något en skicklig utövare faktiskt skulle försöka i labbet? Författarna studerade därför fem berömda, mycket komplexa naturliga produkter, inklusive antibiotika som erytromycin B och discodermolide, och alkaloiden reserpin. För varje fall arbetade DeepRetro tillsammans med mänskliga kemister i en iterativ loop. AI:n föreslog disconnectioner och ruttfragment; kemister gallrade bort tvivelaktiga idéer, rättade subtila stereokemiska problem och knuffade ibland systemet med ett nyckelintermediat. I två fall producerade DeepRetro fullständiga syntesplaner vars övergripande strategi inte motsvarade något författarna kunde hitta i litteraturen, även om de enskilda reaktionerna var kända. Detta tyder på att systemet kan kombinera välkänd kemi till genuint nya globala vägar.
Löften, begränsningar och vad som kommer härnäst
DeepRetro visar att stora språkmodeller kan vara mer än skickliga textgeneratorer; när de är strikt övervakade och kombinerade med etablerade verktyg kan de hjälpa till att navigera det enorma sökutrymmet av möjliga kemiska synteser. Ramverket har fortfarande begränsningar: allmänna språkmodeller föreslår ofta instabila eller orealistiska intermediärer, och fullständigt automatiska lösningar för de allra svåraste molekylerna ligger fortfarande utom räckhåll utan mänsklig tillsyn. Trots detta gör DeepRetros starka resultat på standardtester, dess framgång i utmanande fallstudier och dess öppen-källkodsrelease det till en praktisk mall för framtida AI-assisterad vetenskaplig upptäckt. För icke-specialister är slutsatsen att AI går från att endast förutsäga molekylära egenskaper till att samskapa helt nya laboratorierecept, med potential att snabba upp skapandet av läkemedel och material under de kommande åren.
Citering: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z
Nyckelord: retrosyntes, stora språkmodeller, planering av organisk syntes, läkemedelsupptäckt, beräkningskemi