Clear Sky Science · ja
統一された3D分子表現学習のための等変事前学習型トランスフォーマー
コンピュータに分子を3次元で「見せる」ことを教える
新しい医薬品や材料の設計は、紙の上の平面図ではなく、分子が実際にどのように見え、どのように動くかという3次元的理解に依存します。本論文は、さまざまな種類の分子――小さな薬剤様化合物から大きなタンパク質やその複合体まで――の3次元形状から学習できる強力な新しい人工知能モデルを紹介します。習得した知識を用いて、分子どうしがどれだけ強く相互作用するかや、どれが将来の薬になり得るかを予測します。
多様な分子世界を1つの地図にまとめる
現在の化学向けAIツールの多くは専門特化型で、あるものは小分子のみ、別のものはタンパク質のみ、さらに別のものはその複合体のみで訓練されています。この分断はデータの無駄遣いとなり、ある領域で学んだことを別の領域に移転するのを難しくします。著者らは代わりに、等変事前学習トランスフォーマー(Equivariant Pretrained Transformer、EPT)と呼ぶ単一の「基盤」モデルを構築し、複数の公開データベースから収集した膨大な3D分子構造群から学習させます。これらの構造を共通の枠組みで扱うことで、単純な薬分子であれ複雑なタンパク質の絡まりであれ、原子がどのように配列し相互作用するかの共通パターンをモデルが認識できるようになります。 
分子を扱いやすい断片に分解する
多様で大規模な分子系に対応するために、研究者たちは「ブロック」という考えを導入します――意味のある小さな原子の塊です。小分子では、ブロックは重原子とそれに結合する水素をまとめます。タンパク質では、各アミノ酸がひとつのブロックになります。訓練中、モデルは微細な原子レベルと粗いブロック構造の両方を目にすることで、局所的な化学的詳細とタンパク質の骨格や結合ポケットのような広い3D形状とを結び付けられます。このブロック表示は、非常に異なる分子タイプ全体で通用する共通言語も生み出し、1つのモデルがそれらすべてを理解できるようにします。
ノイズのある構造を修復して学ぶ
「この分子は水溶性だ」「これは強く結合する」といった明示的なラベルを与える代わりに、EPTは自己教師ありで訓練されます。著者らは各分子ブロックを意図的に乱し、ランダムに位置をずらし回転させて本来の位置から外れさせ、それを元に戻すために必要な力やねじれをモデルに推定させます。訓練は基本的な幾何学的ルール――系全体を回転や平行移動しても分子の見え方は変わらないということ――を尊重するため、モデルは物理的に妥当な3次元形状の感覚を学びます。このノイズ除去の課題は、ブロック内外の原子がどのように結び付いているか、そして幾何学の微妙な変化が安定性にどう影響するかをEPTに教えます。 
モデルの実力を試す
500万以上の構造で事前学習した後、EPTは複数の実際の科学的課題に合わせてファインチューニングされます。小分子がタンパク質ポケットにどれだけ強く結合するか、タンパク質界面での単一の変異が結合にどう影響するか、化学者が重視する小分子の重要な物理的性質などを予測します。多様なベンチマークにおいて、この統一モデルは、ある一領域に特化して慎重に設計された既存の最良ツールと同等かそれ以上の性能を示します。特に、小分子のような一種類のデータで訓練しても、タンパク質結合のように一見異なる課題に役立つことがあり、狭いトリックではなく広く有用な化学原理を捉えていることを示しています。
新しいCOVID‑19治療薬の探索
著者らはさらに、薬剤再利用の課題でEPTの実用性を示します。まずモデルをタンパク質–リガンド複合体でファインチューニングし、その後SARS‑CoV‑2の主要プロテアーゼ(ウイルスの複製に不可欠な酵素)に結合する能力を予測して、既承認薬約2,000件をランキングします。既知の抗COVID‑19薬はランキングの上位に上がり、モデルは追加の有望候補も示します。上位の12化合物は計算シミュレーションでさらに詳細に調べられ、そのうち2つは――COVID‑19向けに元々開発されたものではない1つを含め――特に強い予測結合を示し、実験でもマイクロモル濃度でウイルスプロテアーゼ阻害が確認されました。
汎用分子AIへの一歩
平たく言えば、この研究は、単一の幾何学に配慮したAIモデルが多様な分子系の共有された3D理解を学び、それを幅広い科学的問いに応用できることを示しています。分子をブロックに整理し、歪んだ構造を「修復」するようモデルを訓練することで、著者らは単に数値をより正確に予測するだけでなく、新しい抗ウイルス薬の探索のような作業を加速するツールを作り出しました。EPTは、一般目的の分子AIシステムが化学者や生物学者の化学空間の探索をより効率化し、実験を導き、原子構造から実用的な治療薬や材料への道のりを短縮する未来を示しています。
引用: Jiao, R., Kong, X., Zhang, L. et al. An equivariant pretrained transformer for unified 3D molecular representation learning. Nat Commun 17, 2606 (2026). https://doi.org/10.1038/s41467-026-69185-7
キーワード: 3D分子表現, 等変トランスフォーマー, 創薬, タンパク質–リガンド結合, 自己教師あり学習