Clear Sky Science · ja

EGFRを標的とするPROTACの薬物動態を機械学習で予測するツール(EGFR-PROPK)

· 一覧に戻る

治療の難しいがんに向けたより賢い薬設計

有望な新規がん薬が失敗する理由は、標的に届かないからだけではありません。体が薬を速やかに排除してしまったり、望ましくない部位に蓄積したり、吸収が悪かったりすることが大きな原因となります。PROTACと呼ばれる新しい薬のクラスは、かつて「創薬不可能」と考えられていた病原性タンパク質を破壊できますが、その体内での挙動は予測が特に難しいです。本研究は、主要ながんタンパク質に対する一群のPROTACが体内でどう動くかを予測するために特化した機械学習ツール、EGFR-PROPKを紹介します。目的は、研究者がより早い段階で有望な候補を選び、時間や資源を無駄にすることを減らす手助けをすることです。

Figure 1
Figure 1.

新しいタンパク質破壊薬とその課題

PROTACは通常の薬とは異なります。単にタンパク質を阻害するのではなく、細胞の分解機構にそのタンパク質をタグ付けして破壊させます。各PROTACは、病的標的に結合する部分と、細胞内の「分解装置」を呼び寄せる部分を、柔軟な連結鎖でつないだ構造を持ちます。この設計により、従来の薬剤が届きにくかったタンパク質を標的にでき、しばしば一時的な結合で効果を得ることが可能です。しかし、その大きさと複雑さが故に、PROTACは体内での送達や挙動の制御が難しくなります。一般に分子は大きくやや疎水的で血中タンパク質への結合が強く、吸収・分布・代謝・排泄(ADME)が複雑になります。

従来の薬物挙動のルールが通用しない理由

従来の薬剤設計では、分子量、脂溶性(LogP)、いわゆる「drug-likeness」などの単純な指標を用いて化合物の体内挙動を推測します。研究者たちはまず、これらの馴染み深い指標が、表皮成長因子受容体(EGFR)を標的とする100のPROTACがマウスで示した挙動を説明できるかを検討しました。着目したのは、クリアランス(体が薬を除去する速さ)、半減期(血中にとどまる時間)、見かけの分布容積(組織へどれだけ広がるか)という3つの主要な特性です。これらの特性と基本的な記述子を比較すると、データ点はほとんど傾向を示さず散らばっており、単純な化学的ルールだけではPROTACの挙動を予測するには不十分であることが示されました。

専用の予測エンジンを訓練する

このギャップを埋めるため、チームはEGFR-PROPKを構築しました。これはEGFR標的のPROTACに特化して調整された機械学習予測器です。まず100種類のPROTACについてマウスのin vivo試験を行い、投与後のクリアランス、半減期、分布容積を測定しました。次に、各分子を詳細な構造を符号化する複数の「フィンガープリント」と、200の追加化学特徴量で記述しました。これらの数値表現を、表形式データのパターン検出に優れるCatBoostベースのモデルに入力しました。汎用ツールと異なり、EGFR-PROPKはPROTACのin vivoデータで直接訓練されており、複雑なリンカー形状や全体サイズと血中滞留や組織分布との微妙な関係を学習できます。

汎用モデルを上回り、隠れた差異を明らかにする

研究者たちはEGFR-PROPKを、主に従来の低分子向けに作られた広く使われる予測プラットフォームと比較しました。これらの汎用モデルをPROTACに「そのまま」適用すると、予測は不正確で、半減期、クリアランス、組織分布の推定値は実測値から大きく外れることが多く見られました。ある競合モデルをPROTACデータで微調整しても、EGFR-PROPKには及びませんでした。対照的にEGFR-PROPKは、特に半減期とクリアランスに関して、予測値と実験値の一致度が大きく向上し、分布に関しても中程度の改善を示しました。さらに、構造が非常に似ているにもかかわらず挙動が大きく異なる2つのPROTACのケーススタディにおいて、EGFR-PROPKは汎用ツールよりも正確に差異を識別し、PROTAC固有の訓練データの重要性を浮き彫りにしました。

Figure 2
Figure 2.

化学的領域の地図化とその限界

性能指標に加えて、チームは100のPROTACが化学的デザインの幅広い範囲をカバーしているか、それとも狭い一角に偏っているかを確認しました。分子をコアスキャフォールドまで単純化し、数千件の特許PROTACと並べて視覚化したところ、特に柔軟なリンカーにおいて多様な構造タイプを網羅していることが示されました。これは、モデルが主要な構成要素を共有しつつ接続の仕方が異なるEGFR指向のPROTACを改良するのに適していることを意味します。一方で、著者らは本ツールがドメイン特化型であることも強調しており、全く異なる標的や分解経路に基づくPROTACでは精度が低下する可能性があるため、将来的にはデータセット間の転移学習や拡張が必要であると指摘しています。

今後の医薬品開発にとっての意義

非専門家向けの要点は、薬の「配管系」――どのように吸収され、どこへ行き、どのくらいの時間留まるか――が有望ながん治療の成否を左右し、小さな経口薬向けの従来の近道は次世代のデグレーダーであるPROTACにはうまく適用できない、ということです。EGFR-PROPKの開発により、慎重に収集された動物データと高度なパターン認識手法の組合せが、これら複雑な分子の体内挙動を早期により鮮明に示せることが示されました。この種の特化した予測は、化学者が正しいタンパク質を破壊するだけでなく、適切な量で到達させるPROTACを設計するのに役立ち、耐性のあるがんに対するより効果的で安全な治療への道を開くでしょう。

引用: Zhang, R., Li, F., Liu, Y. et al. A machine learning-based pharmacokinetics predictor (EGFR-PROPK) for EGFR-targeting PROTACs. Commun Chem 9, 134 (2026). https://doi.org/10.1038/s42004-026-01938-3

キーワード: PROTACの薬物動態, EGFR標的デグレーダー, 創薬における機械学習, ADMET予測, 標的タンパク質分解