Clear Sky Science · ja

MAMMAL - 生物医療発見のための分子整列型マルチモーダル・アーキテクチャと言語

· 一覧に戻る

なぜより賢い創薬が重要か

新しい薬を見つける過程は遅く、リスクが高く、非常に費用がかかります。多くの候補薬は臨床試験で失敗し、しばしば何年もの努力の後に終わります。一方で、生物学のラボは遺伝子、タンパク質、細胞、化学物質に関する大量のデータを生み出しています。本稿は、これらすべてのデータ型を同時に学習する新しい種類の人工知能システム「MAMMAL」を紹介します。分子、細胞、薬物にまたがるパターンを結びつけることで、研究者がより良いターゲットを選び、より良い薬を設計し、プロセスの早い段階で高コストの行き止まりを避けられることを目指します。

Figure 1
Figure 1.

多様な生物データのための一つの「脳」

今日の生物医療分野のAIツールはしばしば専門家型です:あるモデルはタンパク質配列を扱い、別のモデルは低分子を扱い、さらに別のモデルは遺伝子活性のみを解析します。MAMMALは異なるアプローチを取ります。タンパク質、抗体、低分子医薬品、遺伝子発現プロファイルを、それぞれ同じモデルで読み取れる異なる種類の「文」に見立てます。そのため研究者たちは各データ型を共有のシーケンス形式に変換する柔軟な方法を構築し、公共のタンパク質、抗体、化学物質、細胞レベルのデータセットから集めた約20億件の例を用いて、大規模なトランスフォーマー型ネットワーク(現代の言語モデルにならった構成)を訓練しました。

薬と細胞の「言語」を学ぶ

MAMMALは生物学的情報を理解し生成するよう設計されています。結合強度や薬効のような数値を分類・ランク付け・予測できるほか、新しい配列を創出することも可能で、例えば新たな抗体断片を提案することができます。重要な特徴は、単なる記号だけでなく実測値を直接入力・出力できる点で、実験アッセイからの測定値を扱えます。これにより、薬がタンパク質にどれほど強く結合するかや、がん細胞が治療にどう反応するかについて推論する助けになります。これらのタスクはすべて、あるシーケンスを別のシーケンスに変換するという核となる活動の変形として捉えられており、言語間の翻訳に似た枠組みです。

Figure 2
Figure 2.

創薬パイプライン全体でのモデル評価

この統一的アプローチが本当に有用かを確かめるため、著者らはファインチューニングしたMAMMALを、創薬の現実的な段階を模した11のベンチマークでテストしました。これには、単一細胞遺伝子発現データからの細胞種識別、低分子が血液脳関門を通過するかや有害な副作用を引き起こすかの予測、がん細胞が各種薬剤にどう応答するかの推定、タンパク質同士や低分子薬との結合強度の予測などが含まれます。MAMMALは11のうち9件で報告された最良性能に達するかそれを上回り、しばしば単一データ型に特化して調整された高度に専門化されたモデルに勝ちました。

抗体設計と構造モデルを凌駕する局面

最も注目すべき結果のいくつかはタンパク質ベースの課題から出ました。抗体の「インフィリング」課題では—実際に標的に接触する最も可変なセグメントを補完することが目的—MAMMALは以前の手法よりも正しいアミノ酸をはるかに高頻度で復元しました。特に抗体の結合部位の中心領域のような難しい箇所で顕著でした。研究チームはまた、MAMMALが結合する抗体と結合しない抗体を区別できるかを調べ、結合の間接的な指標として信頼スコアを用いる構造予測ツールAlphaFold 3と比較しました。がんに関連する大きく柔軟なタンパク質を含む7つのテスト標的のうち5つで、MAMMALの結合予測は明らかにより正確でした。MAMMALは配列のみを見て3D構造を参照していないにもかかわらずです。

実世界での影響の予兆

ベンチマークを超えて、研究者たちはモデルの予測が実験室の現実と一致するかを検証しました。彼らはCarfilzomib(主に血液がんに承認されている薬)を含む4つのがん薬を調べ、MAMMALは数百の細胞株にわたるこれらの薬の相対的な強さを正しく予測し、このランキングは集中的な実験で確認されました。この発見は、その薬が現在考えられているよりも固形腫瘍に対して広い有用性を持つ可能性を示唆しており、さらなる検証が必要であることを示しています。モデルはまた、インフルエンザウイルスなどの標的に対する抗体活性を予測する共同研究でも有望な成果を示しています。

将来の医薬品にとっての意味

簡潔に言えば、MAMMALは生物学のための多言語を読み書きする存在のように振る舞い、遺伝子、タンパク質、化学物質レベルで起きる事象を単一の枠組みで結びつけます。多くのタスクでの高い性能は、そのような統一モデルが、実験に入る前にin silicoで治療法を探索するAI支援の「仮想細胞」の中核要素になり得ることを示唆します。実験に取って代わるものではなく—慎重な検証は依然必要ですが—探索の空間を狭め、意外な可能性を浮かび上がらせ、アイデアから承認薬に至る長い道のりを少し速く、より効率的にする手助けが期待できます。

引用: Shoshan, Y., Raboh, M., Ozery-Flato, M. et al. MAMMAL - Molecular Aligned Multi-Modal Architecture and Language for biomedical discovery. npj Drug Discov. 3, 14 (2026). https://doi.org/10.1038/s44386-026-00047-4

キーワード: AI主導の創薬, マルチモーダル生物医療モデル, 抗体設計, タンパク質–医薬品相互作用, 遺伝子発現プロファイリング