Clear Sky Science · ja

polyRETRO: 目標ポリマーの重合クラスとモノマーを予測する言語モデルアプローチ

· 一覧に戻る

デジタルのプラスチック構想を実物の材料に変える

コンピュータ上で新しいプラスチックを設計することは今や迅速かつ日常的になりましたが、実際にそれらの材料を実験室で合成するには依然として多くの人手による推測が必要です。本論文は、化学者が単純な出発分子から目的のポリマーをどのように組み立てるかを見つける手助けをするツール、polyRETROを紹介します。これにより、デジタルのアイデアから実世界の製品への移行が加速する可能性があります。

Figure 1. AIが仮想ポリマー設計を現実の構成要素に結びつけ、デジタルで設計されたプラスチックを実験室で作れるようにする。
Figure 1. AIが仮想ポリマー設計を現実の構成要素に結びつけ、デジタルで設計されたプラスチックを実験室で作れるようにする。

なぜ新しいプラスチックの合成が難しいのか

現代のアルゴリズムは、電子機器、包装材、医療用途などに望ましい特性を持つポリマー構造を提案できます。しかし、多くの設計は画面上に留まったままです。化学者が合成方法を手作業で考えなければならないからです。どの小分子を購入または合成するか、どの反応タイプを使うか、どのようにそれらが長鎖に組み合わさるかを決める必要があります。小分子を対象とした場合、コンピュータは既にこうした“レシピ計画”を提供していますが、ポリマーはより大きく複雑であり、自動化計画に必要な豊富な反応データベースが不足しています。

化学を語る言語モデル

著者らは、このギャップに対処するために、チャットボットを支えるのと同種の大規模言語モデルにポリマー化学を推論させる手法を採りました。彼らのシステムpolyRETROは、ポリマーの繰り返し単位を表す簡潔なテキストコードであるSMILES文字列から始まります。まずAIは、そのポリマーを生成した可能性の高い大まかな反応様式(連鎖成長、段階的縮合、環開裂反応など)を予測します。次に、反応中に官能基がどのように変化したかを化学用語で推論し、どのモノマー分子が存在したはずかを推定します。

言葉と分子をつなぐテンプレート

これを可能にするために、チームは11,000件以上の記録された重合経路を収集し、それらを反応“テンプレート”に抽出しました。各テンプレートは、人間に読みやすい表現で、モノマー上の特定の官能基がどのように結合してポリマー鎖の結合を形成するかを説明します(例えば、アルコールと酸がエステル結合を作るといった具合です)。詳細な原子レベルのパターンと比較する代わりに、言語モデルはポリマーのSMILESコードから直接これらのテンプレートの一つに写像することを学びます。このアプローチは化学的論理を解釈可能に保ちながら、多様な構造に一般化することを可能にします。

Figure 2. AIはポリマー鎖を断片に切り分け、反応を推論し、元のモノマー成分を再構築する。
Figure 2. AIはポリマー鎖を断片に切り分け、反応を推論し、元のモノマー成分を再構築する。

ポリマーバックボーンから構成要素へ

テンプレートが選ばれると、polyRETROは実質的に反応を逆に実行します。繰り返し単位を環の一部として想像し、重合中に形成されたであろう特定の結合を“切断”します。得られた断片はシンソンと呼ばれ、テンプレートの規則に従って現実的なモノマー分子へと補完されます。小さな環の開裂から作られるポリマーの場合、このステップはさらに単純で、モデルは鎖の部分を元の環状モノマーに再閉鎖するだけです。

システムの性能はどれほどか

数千件のテストケースにわたり、微調整されたGPTモデルは反応クラスを約98%の確率で正しく特定し、研究対象の主要な重合ファミリー両方で反応テンプレートを90%以上の精度で選択しました。未見のポリマーに対するフルパイプラインの検証(最終的なモノマー予測ステップを含む)では、正しい出発モノマーを約88%の事例で回復しました。残りの多くはほぼ正しいもので、実験室で実用的な小さな末端基の違いにとどまっていました。

将来の材料に対する意味

非専門家の目には、polyRETROは望ましいプラスチック構造を受け取り、実行可能な材料リストと組み立て手順を提案する翻訳者と見なせます。現在の成果は触媒、溶媒、温度などを推奨するには至っていませんが、化学者が合成計画を立てるための明確で解釈可能な出発点を提供します。このアプローチがより複雑なポリマーや豊富な反応条件に拡張されれば、AI設計によって増大する材料群を実際に合成・試験・利用できる物質へと変える助けになる可能性があります。

引用: Agarwal, S., Xiong, W. & Ramprasad, R. polyRETRO: a language model approach to predict polymerization class and monomers for a target polymer. npj Artif. Intell. 2, 52 (2026). https://doi.org/10.1038/s44387-026-00113-2

キーワード: ポリマー逆合成, 大規模言語モデル, ポリマー設計, モノマー予測, ポリマー情報学