Clear Sky Science · ja

統合的構造モデリングとデータ駆動型ターゲット変異導入によるDEK1カルパイン領域の可溶性の計算最適化

· 一覧に戻る

植物タンパク質の“振る舞い”を制御する意義

植物の成長を制御する多くのタンパク質は巨大で壊れやすく、研究のために溶解させようとすると溶けにくいことが多い。DEK1と呼ばれるタンパク質もその一例で、単一細胞レベルから上位の器官形成まで植物の形作りに関与する。しかしDEK1の重要な部分は細菌で産生すると凝集しやすいため、立体構造が未解明のままであり、理解や応用が進みにくかった。本研究は、計算モデリングとデータ駆動的設計を組み合わせることで、その扱いにくい領域を構造を壊さずにより可溶化できることを示しており、難物質タンパク質の扱い方に対する汎用的な手順を提示している。

Figure 1
Figure 1.

重要な植物タンパク質の問題領域を狙う

DEK1は細胞膜に埋め込まれた非常に大きなタンパク質で、末端にカルパインと呼ばれる切断酵素領域を持つ。遺伝学的研究は、このドメインがコケ類や作物などの正常な発生に不可欠であることを示しているが、その構造は実験的に解かれていない。共通の発現ホストである大腸菌(Escherichia coli)でこのカルパインコア(CysPcと呼ばれる)を作ろうとすると、溶けにくく凝集体(インクルージョンボディ)を形成しがちだ。そのため、詳細な構造・機能解析に必要な量と品質で精製することがほぼ不可能になる。著者らはそこで、全体の折りたたみを維持しつつCysPcドメインをより溶けやすく再設計することを目指した。

ゼロから信頼できる3次元モデルを構築する

この植物カルパインに対する実験構造が存在しないため、研究チームはまずその3次元形状を予測する必要があった。彼らはAlphaFold2、SWISS-MODEL、I-TASSERといった最先端の構造予測ツールを組み合わせ、これらの予測を関連する哺乳類カルパインの既知構造に連結させた。コンセンサスアプローチを用いて、バックボーンの幾何学、パッキング、既知の構造パターンとの整合性を評価する複数の品質検査でモデルを精緻化・検証した。これら独立したチェックにより、統合されたCysPcドメインのモデルは単一の予測よりも信頼できることが示され、配列の小さな変更で可溶性が改善する可能性を探るための堅実な出発点を提供した。

仮想溶媒中で変異を試す

3次元モデルが得られると、著者らは広範な分子動力学シミュレーションを実行し、タンパク質と周囲の水分子を時間発展的に追跡した。彼らは表面に露出し、柔軟で疎水性が高く凝集を促進しそうな残基に注目した。候補位置は個別により水と親和性の高いアミノ酸へ変えられ、それぞれ200ナノ秒のシミュレーションが行われた。各変異体について、水に接触する表面積の変化、タンパク質の凝集度合い(コンパクトさ)、原子のゆらぎの強さなど、可溶性に関連する指標を測定した。多くの一点変異は可溶性を示す指標(溶媒露出や内部水素結合の増加)を穏やかに改善しつつ、全体の折りたたみは保持され、CysPcの基本骨格が慎重に選んだ置換を許容することが示唆された。

アルゴリズムに変異空間を探索させる

一つの残基を変えるだけでは可溶性を劇的に改善することはまれであるため、研究者らは続いて二重および三重変異の組み合わせを検討した。彼らは良好な一重変異を組み合わせて二重・三重のライブラリを作成し、各々を再びシミュレーションした。設計を公平に評価・ランキングするため、可溶性と相関する複数のシミュレーション指標を組み合わせた加重指標を定義し、水和と内部結合の増加を報酬とし、過度の柔軟性をペナルティとした。さらに強化学習アルゴリズム(Proximal Policy Optimization)を用いて、膨大な三重変異の探索空間をナビゲートし、有望な組み合わせを提案させた。このデータ駆動探索は、MUT347と名付けられた特定の三重変異を最有力候補として収束させた。

Figure 2
Figure 2.

よりコンパクトで水和された酵素のバージョン

野生型CysPcドメインとMUT347の詳細なシミュレーションは、設計変異体がどのように異なるかを明らかにした。MUT347はより速く平衡に達し、出発形状からの全体的な偏差が小さく、溶液中での構造的安定性が高いことを示した。ループや鎖末端はやや安定し、コアの触媒領域は元の柔軟性を保っており、機能に重要な運動は温存されていることが示唆された。三重変異体は内部水素結合が増え、重要領域で水にアクセス可能な表面が拡大しており、表面がより整然と水和されている兆候を示した。塩濃度やpHが変わる条件でも、MUT347は元のタンパク質よりも一貫して揺らぎが小さく、凝集しにくい振る舞いに対応する特性を示した。

タンパク質の研究と再利用に向けた意義

非専門家向けの結論として、著者らは主に計算手法を用いて、重要な植物タンパク質の扱いにくく凝集しやすい断片を、事前に実験的構造を知らなくてもより可溶で扱いやすい形に変える手順を構築した。最新の構造予測、長時間スケールのシミュレーション、そして多数の設計選択を同時に扱える学習アルゴリズムを組み合わせることで、折りたたみを安定化し水との相互作用を改善すると予測される三重変異を特定した。実験による検証は依然として必要だが、このフレームワークは産生が難しい他の真核生物タンパク質を救出するために広く有用であり、現在手の届かない構造や機能の解明を助ける可能性がある。

引用: Dabiri, M., Levarski, Z., Struhárňanská, E. et al. Computational optimization of DEK1 calpain domain solubility through integrated structural modelling and data-driven targeted mutagenesis. Sci Rep 16, 7767 (2026). https://doi.org/10.1038/s41598-026-38805-z

キーワード: タンパク質の可溶性, 計算的変異導入, 分子動力学, 植物カルパイン DEK1, タンパク質工学