Clear Sky Science · ja

DeepRetroは大規模言語モデルの反復的推論で逆合成経路を発見する

· 一覧に戻る

なぜより賢い化学が重要か

今日の重要な医薬品や材料の多くは、複雑で合成が難しい分子として始まります。これらの分子を実験室でどう組み立てるかを計画する作業は、精巧な機械を分解して部品から再構築する最良の方法を考えるようなものです。合成設計と呼ばれるこの計画段階は、しばしば医薬品探索や先端材料の開発における主要なボトルネックになります。本論文はDeepRetroを紹介します。これはオープンソースの新しいシステムで、最新のチャットボットに使われるのと同じクラスの大規模言語モデルと、従来の化学ソフトウェアや人間の専門知識を組み合わせて、非常に複雑な分子を作るための現実的なステップバイステップのレシピを設計します。

Figure 1
Figure 1.

大きな分子を扱いやすい断片に分ける

化学者は通常、目標分子から逆向きに考えて合成を計画し、目標を購入可能または合成可能なより単純な断片に“スナップ”して分解します。コンピュータは何十年もこの作業を支援してきましたが、既存のツールは分子が入り組んだり、珍しい構造だったり、反応データベースに類例がない場合に苦戦します。DeepRetroは二つの領域を結合することでこれに対処します。すなわち、既知の反応パターンを高速に適用するルールベースのエンジンと、分子を化学的に妥当な形で非定型に分解する提案ができる言語モデルの“脳”です。AIに全工程のレシピを一度に考えさせるのではなく、DeepRetroはひとつの逆反応ステップだけを順に求め、それぞれの提案を慎重に検証します。

AIの信頼性を保つ

大規模言語モデルの重要な問題は「幻覚」です—基本的な化学に反するステップを自信を持って提案してしまうことがあります。DeepRetroはAIを複数の自動検証層で包囲します。提案された各中間体は、原子の結合数が正しいかなどの単純な正しさ、想定される安定性、および反応全体との内部整合性について検査されます。これらの検査に失敗した提案は却下されます。検査を通過したものについては、より伝統的な探索エンジンを呼び出して、既知の化学がそれらの断片を実際に購入可能な出発物質へつなげられるかを確認します。化学者は任意の時点でグラフィカルインターフェースを通じて介入できます: 構造を編集したり、経路の一部だけを再実行したり、多段階合成を実用化する保護基を追加したりできます。

Figure 2
Figure 2.

システムの性能評価

DeepRetroの性能を評価するために、著者らは特許データベースからの標準的な反応ベンチマーク集合で試験しました。単段階予測—与えられた生成物を作る反応物を推測するタスク—では、主要な前駆体を正しく特定する点で、少数成分が異なる場合でも既存の強力なツールと同等かそれ以上の成績をいくつかの指標で示しました。多段階計画では、DeepRetroは難易度の高い二つのテストセットのほぼ全てのターゲットを解決し、特に薬物様分子のコレクションで従来の最先端手法を上回りました。重要な点として、これらのテストは人間の修正なしの完全自動モードで実行されており、専門家が介入する前でもフレームワークが堅牢であることを示しています。

実世界のケーススタディ

ベンチマークだけでは化学者が本当に気にする点、すなわち提案された経路が熟練した実験者が実際に試すようなものに見えるかどうかを見落とすことがあります。そこで著者らは、抗生物質エリスロマイシンBやディスコデルモライド、アルカロイドのレセルピンなど、有名で非常に複雑な天然物五例を研究しました。各ケースでDeepRetroは化学者と反復的ループで協働しました。AIは切断点や経路断片を提案し、化学者は疑わしいアイデアを取り除き、微妙な立体化学の問題を修正し、必要に応じて重要な中間体を提示してシステムを促しました。二例では、DeepRetroは個々の反応自体は既知でありながら、文献で見つからなかった全体戦略を持つ合成計画を作成しました。これはシステムが馴染みのある化学を組み合わせて真に新しい全体経路を生み出せる可能性を示唆します。

期待、限界、今後の展望

DeepRetroは、大規模言語モデルが単なる巧みなテキスト生成器以上になり得ることを示しています。厳密に監督され既存のツールと組み合わせることで、膨大な化学合成の探索空間を航行する助けになります。とはいえ限界もあります: 汎用の言語モデルは不安定または現実的でない中間体を提案することがあり、最も難しい分子に対する完全自動の解決は人間の監督なしには到達しません。それでも、DeepRetroの標準テストでの高い性能、難しいケーススタディでの成功、そしてオープンソース公開は、将来のAI支援科学発見の実用的なテンプレートとなります。専門外の読者にとっての要点は、AIが分子特性の予測から完全に新しい実験レシピの共設計へと移行しつつあり、今後数年で医薬品や材料の創出を加速する可能性があるということです。

引用: Sathyanarayana, S.V., Hiremath, S.D., Rahil Kirankumar, S. et al. DeepRetro discovers retrosynthetic pathways through iterative large language model reasoning. Sci Rep 16, 8448 (2026). https://doi.org/10.1038/s41598-026-38821-z

キーワード: 逆合成, 大規模言語モデル, 有機合成計画, 医薬品探索, 計算化学