Clear Sky Science · ja
再利用性レポート:メタラーニング基盤モデルによる天然物の抗菌活性予測の性能評価
より速く新しい抗生物質を探す
抗生物質耐性は増加している一方で、新薬の発見は極めて遅く、しばしば試行錯誤に頼る現場作業が必要です。本研究は、もともと膨大な薬物データで訓練された強力な人工知能が、少量の新しい実験データだけで、どの植物由来化合物が細菌に対して有効かを素早く予測できるかを探ります。成功すれば、こうしたツールは研究者が限られた実験時間を最も有望な候補に集中させ、次世代の抗生物質探索を加速する手助けになります。
なぜ植物由来化学物質が重要か
多くの優れた抗生物質は、植物や微生物に由来する天然物として始まりました。これらの分子は細菌の増殖を抑えることができますが、自然界から新しいものを見つけるのは干し草の山から針を探すようなものです。研究者は多数の化合物を多くの細菌株に対して試験しなければならず、各試験はコストがかかります。さらに、現代の深層学習手法が高い性能を発揮するために必要な、大規模で精密にラベル付けされたデータセットはこの分野では稀です。だからこそ、少数の例で特定のタスクに微調整できる大規模な汎用AIシステム――いわゆる「ファンデーションモデル」が、抗生物質探索の重要な試験場になるのです。

ファンデーションモデルが抗菌性を学ぶ
研究チームはActFoundと呼ばれるファンデーションモデルに着目しました。これはChEMBLやBindingDBのようなリソースから得た膨大なデータを用いて、異なる化学物質が生物学的標的にどの程度影響するかを予測するよう訓練されたモデルです。各化合物に対して単一の数値を予測するのではなく、ActFoundは同一の実験内で化合物のペアを比較し、どちらがより活性が高いかを推定することで学習します。この“ペアワイズ”学習と、メタラーニングとして知られる訓練戦略を組み合わせることで、少数のラベル付き例しかない新しい予測タスクにも迅速に適応できるよう設計されています。まさに多くの抗生物質スクリーニングで見られる状況に対応するためのアプローチです。
実際の植物データでモデルを検証する
ActFoundの再利用性を評価するために、著者らは様々な細菌の増殖阻害能力が試験された植物由来天然物の厳選されたデータセットでモデルを微調整しました。各細菌株を個別のタスクとみなし、モデルは株ごとに8〜128個の化合物、あるいは利用可能なデータの固定割合のみを用いて適応させました。さらに、ペアワイズ比較を用いないより単純なメタラーニングやトランスファーラーニングのモデルと比較しました。これらのテスト全体を通じて、ActFoundは他の種類の薬物データで示したほどの精度には到達しませんでした。しかし、利用可能なデータが非常に少ない、すなわち各株につき数個程度の化合物しかない場合には、ActFoundおよびそのトランスファーラーニング版は一般に他の手法と同等かそれ以上の成績を示しました。
類似性が有利な場合と不利な場合
ActFoundは類似した分子は類似した挙動を示すと仮定しますが、これは関連する化学物質のグループを中心にデータセットが構成されている場合にはうまく機能します。しかし、この天然物データセットは化学的に多様で、密接に関連する「ファミリー」を欠くことがしばしばありました。この多様性は科学的に価値がある一方で、ペアワイズ学習戦略を弱めます。実験内の化合物同士が非常に異なる場合、モデルは安定した比較を学習するのが難しくなります。著者らはまた、元のActFound論文で提案された、新しいタスクでの性能を事前に予測する単純な診断指標が、これらの天然物データに対しては当てはまらないことを見出しました。これは新しい化学空間に移行する際の重要な制限を浮き彫りにします。

今後の創薬にとっての意味
専門外の読者にとっての結論は、ActFoundのようなファンデーションモデルはデータが乏しい状況で創薬を支援する有望なツールである一方で、万能薬ではないということです。本研究では、少数の植物由来化合物しか訓練に使えない場合、ActFoundおよびそのトランスファーラーニング版はしばしば競合手法と同等かそれ以上の成績を収めましたが、化学的に非常に多様なこのデータセットでは苦戦しました。本研究は、こうしたAIモデルが構造活性相関の集中的な研究のように、化学的に類似した化合物が多く含まれるデータで最も有用であることを示唆していますが、全く新しい種類の分子の挙動を予測する際には依然として信頼性が低いことを示しています。言い換えれば、AIは探索の絞り込みを助けることはできても、本当に新しい化学領域を切り拓く上で最も困難な部分は依然として残っています。
引用: Butt, C.M., Walker, A.S. Reusability Report: Evaluating the performance of a meta-learning foundation model on predicting the antibacterial activity of natural products. Nat Mach Intell 8, 270–275 (2026). https://doi.org/10.1038/s42256-026-01187-y
キーワード: 抗生物質の発見, 天然物, 深層学習, メタラーニング, 薬物スクリーニング