Clear Sky Science · de

DeepRetro entdeckt retrosynthetische Wege durch iteratives Reasoning mit großen Sprachmodellen

· Zurück zur Übersicht

Warum klügere Chemie wichtig ist

Viele der heute wichtigsten Arzneimittel und Materialien beginnen als komplizierte, schwer herzustellende Moleküle. Zu planen, wie man diese Moleküle im Labor aufbaut, ist vergleichbar mit der Frage, wie man am besten ein komplexes mechanisches Gerät auseinander- und wieder zusammenbaut. Dieser Planungsschritt, die Synthesedesign, ist oft ein wesentlicher Engpass bei der Wirkstoffforschung und der Entwicklung fortschrittlicher Materialien. Dieser Artikel stellt DeepRetro vor, ein neues Open‑Source‑System, das große Sprachmodelle – dieselbe Klasse von KI, die modernen Chatbots zugrunde liegt – zusammen mit traditioneller Chemiesoftware und menschlicher Expertise nutzt, um realistische Schritt‑für‑Schritt‑Rezepte zur Herstellung sehr komplexer Moleküle zu entwerfen.

Figure 1
Figure 1.

Große Moleküle in handhabbare Teile zerlegen

Chemiker planen eine Synthese üblicherweise rückwärts vom Zielmolekül: sie „knipsen“ es gedanklich in einfachere Bausteine, die gekauft oder hergestellt werden können. Computer unterstützen diese Aufgabe seit Jahrzehnten, doch bestehende Werkzeuge tun sich schwer, wenn Moleküle zu verschlungen, exotisch oder ganz anders als alles in ihren Reaktionsdatenbanken sind. DeepRetro begegnet diesem Problem, indem es zwei Welten kombiniert: schnelle, regelbasierte Engines, die bekannte Reaktionsmuster anwenden, und ein sprachmodellgestütztes «Gehirn», das ungewöhnliche, aber chemisch sinnvolle Zerlegungen vorschlagen kann. Statt die KI zu bitten, in einem Schritt ein komplettes Rezept zu erfinden, fragt DeepRetro sie nur nach einem Rückwärtsschritt auf einmal und überprüft jeden Vorschlag sorgfältig.

Die KI auf Ehrlichkeit prüfen

Ein zentrales Problem großer Sprachmodelle ist, dass sie „halluzinieren“ können – sie schlagen mitunter selbstbewusst Schritte vor, die gegen grundlegende Chemie verstoßen. DeepRetro hüllt die KI in mehrere Schichten automatischer Prüfungen. Jedes vorgeschlagene Zwischenprodukt wird auf einfache Korrektheit getestet (zum Beispiel, ob Atome die richtige Anzahl an Bindungen haben), auf wahrscheinliche Stabilität und auf innere Konsistenz mit der übrigen Reaktion. Vorschläge, die diese Tests nicht bestehen, werden verworfen. Für die, die bestehen, ruft das System dann eine traditionellere Suchmaschine auf, um zu prüfen, ob bekannte Chemie diese Bausteine wieder mit realen, käuflichen Ausgangsmaterialien verbinden kann. Chemiker können jederzeit über eine grafische Oberfläche eingreifen: Strukturen bearbeiten, nur einen Teil eines Pfads neu berechnen oder übliche Schutzgruppen hinzufügen, die mehrstufige Synthesen praktisch machen.

Figure 2
Figure 2.

Das System auf die Probe stellen

Um zu prüfen, wie gut DeepRetro funktioniert, bewerteten die Autoren es an standardisierten Benchmark‑Sammlungen von Reaktionen aus Patentdatenbanken. Bei Einzel­schritt‑Vorhersagen – also dem Erraten, welche Edukte ein Produkt ergeben könnten – erreichte das System in mehreren Kennzahlen die Leistung starker bestehender Werkzeuge oder übertraf sie, insbesondere beim korrekten Identifizieren des Hauptvorläufers, selbst wenn Nebenkomponenten abwichen. Bei der Planung mehrstufiger Synthesen löste DeepRetro nahezu alle Ziele in zwei anspruchsvollen Testsets, darunter eine Sammlung besonders kniffliger, arzneimittelähnlicher Moleküle, und übertraf frühere Spitzenmethoden. Wichtig ist, dass diese Tests vollständig automatisch, ohne menschliche Korrekturen, durchgeführt wurden, was zeigt, dass das Framework bereits vor dem Eingreifen von Experten robust ist.

Praktische Anwendungsbeispiele

Benchmarks allein können verfehlen, worauf es Chemikern wirklich ankommt: Sieht eine vorgeschlagene Route so aus, wie ein erfahrener Praktiker sie im Labor versuchen würde? Die Autoren untersuchten daher fünf berühmte, sehr komplexe Naturstoffe, darunter die Antibiotika Erythromycin B und Discodermolide sowie das Alkaloid Reserpin. In jedem Fall arbeitete DeepRetro in einer iterativen Schleife mit menschlichen Chemikern zusammen. Die KI schlug Disconnection‑Punkte und Routenteile vor; Chemiker strichen zweifelhafte Ideen, korrigierten subtile stereochemische Probleme und stießen das System gelegentlich mit einem wichtigen Zwischenprodukt an. In zwei Fällen lieferte DeepRetro vollständige Synthesepläne, deren Gesamtstrategie in der Literatur nicht zu finden war, obwohl die einzelnen Reaktionen bekannt waren. Das deutet darauf hin, dass das System vertraute Chemie zu tatsächlich neuen, globalen Routen kombinieren kann.

Versprechen, Grenzen und Ausblick

DeepRetro zeigt, dass große Sprachmodelle mehr sein können als geschickte Textgeneratoren; wenn sie eng überwacht und mit etablierten Werkzeugen gekoppelt werden, können sie helfen, den enormen Suchraum möglicher chemischer Synthesen zu navigieren. Das Framework hat weiterhin Grenzen: Allgemeine Sprachmodelle schlagen oft instabile oder unrealistische Zwischenprodukte vor, und vollständig automatische Lösungen für die allerkompliziertesten Moleküle bleiben ohne menschliche Aufsicht unerreichbar. Dennoch machen die starke Leistung in Standardtests, der Erfolg bei anspruchsvollen Fallstudien und die Open‑Source‑Veröffentlichung DeepRetro zu einer praktischen Blaupause für zukünftige von KI unterstützte wissenschaftliche Entdeckungen. Für Nicht‑Spezialisten lautet die Quintessenz: KI bewegt sich von der reinen Vorhersage molekularer Eigenschaften hin zur gemeinsamen Gestaltung völlig neuer Laborrezepte, mit dem Potenzial, die Entwicklung von Medikamenten und Materialien in den kommenden Jahren zu beschleunigen.

Zitation: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z

Schlüsselwörter: Retrosynthese, große Sprachmodelle, Planung organischer Synthesen, Wirkstoffforschung, computational Chemistry