Clear Sky Science · ja
Q-CaDD: 表皮成長因子受容体のための量子計算と機械学習によるインシリコ手法の加速
将来のがん薬に向けて新しい計算ツールが重要な理由
新薬の設計は、あり得る分子の干し草の山から針を探すようなものです。表皮成長因子受容体(EGFR)というタンパク質が駆動するがんに対しては、このタンパク質に強く結合しつつ患者にとって安全である化合物を見つけなければなりません。本稿はQ-CaDDを紹介します。これは、現在の機械学習と新興の量子計算の考え方を組み合わせ、数十万に及ぶ候補分子をより効率的にふるい分けし、より安全で有効な薬になり得るものを特定することを目指すコンピュータベースの枠組みです。
がんに関連するタンパク質からデジタルな探索問題へ
EGFRは細胞表面に位置し、細胞の増殖や分裂を制御するのに役立ちます。非小細胞肺がんなどで機能不全を起こすと、細胞が制御不能に増殖することがあります。EGFRを阻害する薬は既に存在しますが、がんは耐性を獲得することがあり、すべての患者に効くわけではありません。新しい化合物を一つずつ実験室で試す代わりに、Q-CaDDはコンピュータシミュレーションを用いて化学空間を一括で探索し、EGFRに結合しつつ低毒性が示唆される分子を探します。このアプローチは、創薬の初期段階をより速く、安価に、かつ指針のあるものにすることを目指しています。

膨大な分子ライブラリの増殖と剪定
まず枠組みは、公開データベースから約24,000件の既知のEGFR阻害分子を収集するところから始まります。次に生成アルゴリズムを使ってそれらの構造を系統的に変化させ、約20万件の関連候補を生み出します。続いて、分子が大きすぎる、脂溶性が高すぎる、あるいは体内で好ましく振る舞わないと見なされるものを除くために、2つの確立された「ドラッグライクネス」フィルターが適用され、セットは5万件未満に削減されます。次にドッキングプログラムが各分子をEGFRの三次元ポケットに仮想的に当てはめ、どれだけ強く結合する可能性があるかを推定します。これにより、化学的に妥当で標的と良好に相互作用すると予測される化合物に注目が絞られます。
毒性の警告サインを認識するようにコンピュータを訓練する
EGFRへの結合は物語の半分に過ぎません。有望な化合物は健康な組織を傷つけないことも必要です。毒性を推定するために、研究ではTox21という大規模な公開データセットを利用します。これは1万件以上の化学物質が様々な細胞経路に及ぼす影響を記録したものです。著者らは、注釈が充実しておりいくつかのがんに生物学的に関連するため、アンドロゲン受容体に関連する経路に注目しました。各Tox21分子は、その構造的特徴と他化学物質との類似性をとらえる数値的フィンガープリントに変換されます。これらのフィンガープリントは、ニューラルネットワーク、決定木、従来のサポートベクターマシンに加え、単純な量子回路を用いて化合物を異なる数学空間で比較する量子インスパイアードのサポートベクターマシンなど、いくつかの予測モデルに供給されます。

量子予測と古典的予測のブレンド
単一のモデルに賭けるのではなく、Q-CaDDは4つの出力をすべて組み合わせたアンサンブルを採用し、ニューラルネットワークに最も大きな重みを与えつつも量子モデルからの弱いが特徴的な信号も取り入れます。未見のTox21データで検証したところ、この混合アプローチはROC曲線下面積(AUC)という標準的なランキング指標で、個々のモデルよりも有害性の高低を区別する性能が優れていました。改善は控えめであり、量子部分は実際の量子チップではなくシミュレータ上で動作しているものの、量子インスパイアード手法が既存の機械学習パイプラインに有用なニュアンスを付加できる可能性を示唆しています。
コンピュータによるスコアから将来の実験室テストへ
毒性モデルを検証した後、著者らはQ-CaDDの全パイプラインをフィルタ済みのEGFR重視ライブラリに適用します。毒性について二者択一の判定は行わず、連続的なリスクスコアを保持してそれをドッキングによる結合強度推定と組み合わせます。これにより、優先順位の付けられた候補分子リストが作成され、その中には参照薬よりEGFRに強く結合すると見積もられ、かつ予測毒性が低いものも含まれます。これらの分子が新薬であるとは主張しておらず、実験室での検証に値するリードとしてマークされています。専門外の読者への本研究の主な結論は、量子コンピュータがすでに創薬を革命的に変えたということではなく、古典的手法と量子インスパイアード手法を注意深く組み合わせたハイブリッドは、現在のハードウェアの限界を現実的に見据えながらも探索を鋭くし、より良い候補をより速く示すのに既に役立ち得る、ということです。
引用: Badarala, L. Q-CaDD: accelerating in silico methodologies with quantum computation and machine learning for Epidermal growth factor receptor. Sci Rep 16, 14436 (2026). https://doi.org/10.1038/s41598-026-44978-4
キーワード: 量子ドラッグディスカバリー, EGFR阻害剤, 機械学習 毒性, 仮想スクリーニング, 非小細胞肺がん