Clear Sky Science · ja

物理知識に基づく幾何学的不変学習による高精度のタンパク質間相互作用モデリング

· 一覧に戻る

なぜタンパク質の相互作用が重要か

細胞内では、タンパク質は単独で働くことは稀です。互いに衝突し、パズルのピースのように組み合わさって一時的な複合体を作り、シグナル伝達や輸送、感染対策などを制御します。二つのタンパク質が三次元でどう出会うかを正確に知ることは、病気の発生機序の解明や新薬・抗体設計に直結します。しかし、こうした分子の「スナップショット」を実験で得るのは時間と費用がかかり、現行のAIツールはデータが乏しい場合に弱点を見せます。本研究はその隙間を埋めることを目的としたProTactという新たな計算手法を提案します。

現在の構造予測ツールの限界

AlphaFoldのようなシステムは単一タンパク質や一部の複合体の形状予測を大きく変えました。これらは進化のパターンから学ぶため、多数の関連配列が存在する場合に最も良く機能します。しかし、ウイルス蛋白、設計タンパク質、抗体など、豊富な進化的履歴を持たない重要な標的が多くあります。そのような場合、既存のツールは特に二者の原子が接する正確な接触点で誤判定をすることがあります。著者らは、この問題を克服するには配列パターンに加えてタンパク質表面の物理的形状とフィットにより注意を払う必要があると主張します。

タンパク質表面を読み取る新しい方法

ProTactは各タンパク質を空間的に結びついた残基のネットワークとして扱い、その外表面がどのように相補的かに着目します。回転や平行移動を行っても内部表現が変わらないよう慎重に設計された幾何学的エンコーダを用います。第二のモジュールは三角法に着想を得た規則を適用し、残基群によって形成される三角形を考慮することで、単純な二体接触にとどまらない多体効果を捉えます。これらを組み合わせることで、二つのタンパク質が複合体を形成したときに接触する可能性が高い残基を示すマップが生成されます。ProTactは高品質な実験構造でも、他のツールが予測した構造でも動作し、配列情報が利用できる場合はそれを用いるが依存はしません。

Figure 1. 幾何を意識したAIモデルがタンパク質を3次元空間で最適な相手に導く仕組み
Figure 1. 幾何を意識したAIモデルがタンパク質を3次元空間で最適な相手に導く仕組み

手法の性能

研究者らは、コミュニティ全体の評価実験からの難易度の高いケースを含む複数の標準的なタンパク質対コレクションでProTactを評価しました。これらのベンチマーク全域で、ProTactは主要な配列ベースおよび構造ベースの手法より一貫して接触残基を高精度に同定しました。例えば、広く使われる二つのデータセットにおいて、一般的な精度スコアを既存最良手法と比較して約3割向上させました。入力構造が実験由来ではなくAlphaFold由来でノイズを含む場合でも、ProTactは競合ツールより高い精度を維持しました。また、最近解かれたタンパク質対の大規模なブラインドテストでも、対称複合体と非対称複合体の両方で高い性能を示しました。

接触マップから完全な複合体へ

どの残基が接触するかを予測することは問題の一部にすぎません。研究者は二つの相手の完全な三次元配置も求めます。ProTactの接触マップはドッキング姿勢、すなわち二つのタンパク質がどのように位置するかの完全モデルに変換できます。標準的な整列アルゴリズムを使用すると、ProTactの提案する姿勢は他の接触ベース手法より実験的に決定された複合体に近いことが示されました。これらの接触予測を既存のドッキングプログラムへの拘束条件として加えると、多くのテスト対象で精度が向上します。さらに、ProTactはAlphaFold3が生成した候補複合体のランク付けを改善し、実験的な品質スコアにより近づけることで、配列データが乏しいいくつかの抗体–抗原例で結果を向上させました。

Figure 2. 二つのタンパク質表面が接する接触点をモデルがどのように予測するかの段階的解説
Figure 2. 二つのタンパク質表面が接する接触点をモデルがどのように予測するかの段階的解説

抗体と創薬への示唆

抗体は結合ループが大きく変動し、進化的シグナルが弱いことが多いため特に難しい検証対象です。著者らはまず大規模な一般データセットでProTactを訓練し、その後抗体–抗原複合体でファインチューニングすることで、他の専門手法と比べて接触予測とドッキング品質が向上することを示しました。SARS-CoV-2ウイルスに対する抗体の事例研究では、ProTactは限られた配列情報しかない状況でも競合手法よりはるかに正確な複合体を生成しました。これは、表面の幾何学的推論の詳細さが進化的手がかりの欠如を部分的に補えることを示唆しています。

今後の意味

専門外の読者に向けた要点は、ProTactが長い進化履歴に主に依存するのではなく、二つのタンパク質表面がどのように「かみ合う」かを学習する点にあります。形状相補性といった物理的な考えを現代的なニューラルネットワークに織り込むことで、どこでタンパク質が接触するか、どのように複合体を形成するかについてより信頼できる推定を提供します。出発点となる構造の質に依存することや、タンパク質が大きく形を変える場合には苦戦する点は残りますが、ProTactはデータの乏しい状況でタンパク質の結び付きマップを作る強力な新しいツールとなり得ます。これにより細胞機構の基礎研究が加速し、タンパク質相互作用を再設計することで機能する新規治療法の設計を支援する可能性があります。

引用: Rao, J., Liu, D., Zhou, X. et al. Accurate protein-protein interactions modeling through physics-informed geometric invariant learning. Commun Biol 9, 685 (2026). https://doi.org/10.1038/s42003-026-09809-2

キーワード: タンパク質間相互作用, 構造予測, ドッキング, AlphaFold, 抗体結合