Clear Sky Science · ja
タンパク質の立体構造多様性をモデル化するための共進化的制約の解きほぐし
形を変える機械としてのタンパク質
タンパク質は生命を支える小さな機械であり、多くは微妙な形の変化によって機能します。これらの変化はシグナルをオン/オフに切り替えたり、分子のゲートを開閉したり、医薬品が狙う結合ポケットの形を変えたりします。それにもかかわらず、ほとんどの計算ツールはタンパク質に「正しい」構造を1つだけ割り当てようとし、その柔軟性という本質を隠してしまいます。本論文はEvoSplitという新しい手法を提示し、配列に刻まれた進化の記録を読み解いて、機能的に重要ないくつかの異なる形――実験でまだ観察されていないものを含む――を明らかにし、薬剤探索の新たな道を開く可能性を示します。

医療にとってのタンパク質の柔軟性の重要性
細胞内でタンパク質はめったに静止していません。温度や酸性度、結合相手、化学修飾の変化に応じて屈曲したりねじれたり、時には部分的に折り直したりします。こうした運動は側鎖のわずかな移動のように小さなものから、ヘリックスがシートに転換するような劇的な変化までさまざまです。受容体がホルモンを感知するしくみ、トランスポーターが膜を横断して分子を運ぶしくみ、オンコタンパク質ががんを促進するしくみなどは、これらの変化に深く依存しています。もしタンパク質を一つのスナップショットしか知らなければ、活性型や薬剤が結合しうるポケット、あるいは病気を引き起こす立体配座を見逃す可能性があります。したがって、タンパク質の安定した形の「配役表」を正確に捉えることは、生物学の理解と標的治療設計にとって極めて重要です。
進化の隠れた手がかりを読む
何百万年にもわたって、タンパク質配列は単一の構造だけでなく、しばしば複数の生物学的に重要な形を保持するように進化してきました。関連するタンパク質群で二つのアミノ酸が協調して変異する傾向があるとき、それはそれらが少なくとも一つの立体配座で接触を保たねばならないことを示唆します。AlphaFold2のような現代のディープラーニングシステムが優れているのは、このような共進化パターンを大量の関連配列(多配列アラインメント)から抽出する点にあります。しかし、タンパク質が複数のフォールドをとりうる場合、異なる状態のシグナルが混ざり合ってしまい、標準的な手法は通常それらを一つの平均化された構造に収束させてしまいます。従来の手法は配列全体の類似性に基づいて配列をクラスタリングしてこれを分けようとしましたが、実際に構造的嗜好を符号化しているペアごとのパターンはほとんど無視していました。
EvoSplitが重なり合う形を分離する方法
著者らはMSA Transformerと呼ばれるタンパク質言語モデルに基づいて構築しています。このモデルは注意機構を用いて、どの配列のどの残基が互いに「注目」しているかを学習します。複数の既知構造をもつタンパク質について、各配列の注意パターンは一般に一方の立体配座の接触マップに他方よりも強く類似することを示しています。言い換えれば、各配列は好む形の指紋を携えています。EvoSplitはこれを利用し、生の配列類似性ではなく注意行列をクラスタリングの特徴量として用いてアラインメントをサブグループに分割します。各クラスターは個別にAlphaFold2に入力され、構造予測器に対してより明瞭な、配座特異的な進化的プロンプトを与えます。フォールドスイッチが知られている85のタンパク質に対して、EvoSplitは従来の配列ベースのクラスタリング法よりも実験構造とよく一致し、特に希にサンプリングされる状態に対して高い確信度を示すモデルを生成しました。
訓練データを超えて新しい状態を見つける
強力なニューラルネットワークに関する重要な懸念は、単に訓練セットの構造を「記憶」して新しい構造を発見していない可能性です。EvoSplitが真に情報を付加しているかを検証するため、著者らはAlphaFold2の元の訓練に含まれていなかった代替状態を持つトランスポーターや受容体のセットに取り組みました。ここでもEvoSplitは内向き・外向きの両方の形や、活性型と非活性型の異なる形を高い構造的類似性で再現しました。この手法はより探索的な課題にも拡張可能で、人間のがんに関連する100以上のタンパク質に適用したところ、複数の立体配座をとると考えられる54の候補を指摘しました。キナーゼLCKや細胞周期調節因子サイクリンD1のようなものでは、EvoSplitは関連タンパク質から知られる構造を反映するドメイン配置を示唆し、観察されていないが生物物理的に妥当な状態を示唆しています。

がん関連スイッチにおける驚くべき新しいフォールド
最も興味深い結果の一つは、HRASやKRASのような小型GTPアーゼに関するものです。これらは腫瘍で頻繁に変異する古典的な分子スイッチです。通常、これらのタンパク質はヌクレオチド結合部位近傍の微妙な再配列でオン・オフを切り替え、残りのフォールドは概ね保持します。しかしEvoSplitは繰り返し、タンパク質の開始付近にある一つのヘリックスがシートに変換して全体的な位相トポロジーを変える代替配座を予測しました。このパターンは5つの関連GTPaseにわたって現れ、単なる偶然ではないことを示唆します。この異例の状態のシミュレーションは数百ナノ秒にわたって安定なままであり、進化的結合解析はその独特なシート接触と一致する個別の接触シグナルを示しています。著者らがHRASといくつかの既知の結合相手との相互作用をモデル化したところ、古典的な配座と新しい配座の両方が安定な複合体を形成しましたが、接触界面がずれており、代替フォールドが異なるシグナル伝達挙動を支えうることを示唆しています。
今後の医薬品設計への含意
非専門家にとっての核心的なメッセージは、タンパク質は従来の構造予測が示してきたよりも多くの形――ひいてはより多様な機能的可能性――を内包しているかもしれないということです。EvoSplitは進化に導かれたパターン認識を用いて、これらの隠れた状態を平均化するのではなく分離します。既知のフォールドスイッチングタンパク質で従来法を上回り、よく研究された受容体やトランスポーターで代替状態を発見し、HRASのようながん関連スイッチに対して新しく安定なフォールドを示唆したことから、本研究はマルチステートモデリングを常用化すべきだと主張します。実践的には、より豊かな構造カタログは新しい薬剤ポケットを浮かび上がらせ、特定の変異が有害な理由を説明し、単一の静的構造を超えて見ることで初めて見えてくる経路を指し示す可能性があります。
引用: Li, S., Zhang, C., Kong, L. et al. Disentangling coevolutionary constraints for modeling protein conformational heterogeneity. Commun Chem 9, 146 (2026). https://doi.org/10.1038/s42004-026-01940-9
キーワード: タンパク質の立体構造ダイナミクス, 共進化シグナル, AlphaFold2, がん関連タンパク質, GTPaseのフォールド切り替え