Clear Sky Science · ja
IL2Pepscan:IL-2を誘導するペプチドを予測する機械学習フレームワークと世界のウイルスプロテオームにおけるその同定
小さなタンパク断片で免疫を教育する
現代のワクチンやがん治療は、薬で病気を一掃するのではなく、免疫系を精密に誘導する方向へますますシフトしています。本研究は、ペプチドと呼ばれる小さなタンパク断片をどのように選べば強力な免疫伝達物質であるインターロイキン‑2(IL‑2)を喚起できるかを探ります。高度な計算モデルを用いて、既存の免疫データと数千種のウイルスのタンパクカタログの両方を検索し、より良いワクチンや免疫療法の設計に役立つかもしれない分子的な“針”を分子の干し草の山から見つけ出します。
なぜIL-2が健康と疾患で重要なのか
IL‑2は小さなシグナル分子で、T細胞として知られる主要な免疫細胞の増殖因子のように働きます。これらの細胞がウイルスやがん細胞のような脅威に初めて出会うと、IL‑2を放出し、それがT細胞の増殖、分化、免疫記憶の形成を促します。IL‑2はまた、自己組織への攻撃を抑える制御性T細胞の維持にも寄与します。この二重の役割のため、IL‑2はメラノーマのようながん治療薬として用いられてきたほか、自己免疫疾患への応用も検討されています。ただしIL‑2を直接投与すると患者に負担が大きくなるため、体内でより制御された局所的なIL‑2産生を促す安全なペプチドを設計することへの関心が高まっています。

IL-2誘導ペプチドの“風味”を学ぶ
研究者らはまず、実験室で既に試験されてIL‑2を誘導するか否かがラベル付けされた何千ものペプチド配列を出発点としました。重複、異常な構成要素、長すぎるまたは短すぎるペプチドを除去してデータセットを精査し、6,000を超える十分に特徴づけられた例を得ました。これらのペプチドを構成するアミノ酸を比較すると、両群の間に明確な違いがありました。IL‑2を誘導するペプチドは、ロイシンやアラニンのような疎水性(疎水)アミノ酸が豊富である傾向があり、誘導しないペプチドはより極性や電荷を持つ残基に偏っていました。“LEGS”や“ALEG”のような短い配列(モチーフ)がIL‑2誘導ペプチドにのみ現れることもあり、免疫活性化を引き起こす構造的な手がかりを示唆していました。
免疫を高めるパターンを見分ける機械を訓練する
これらのパターンを実用的な予測ツールに変えるために、チームは各ペプチドをその組成やアミノ酸配列の順序を捉える数値的な記述に変換しました。ランダムフォレスト、サポートベクターマシン、ブースト木などの一般的なアルゴリズムに加え、言語や画像タスクでよく使われるディープラーニング構造を含む様々な機械学習手法を試しました。さらに、数億のタンパク配列で事前学習された大規模なタンパク「言語モデル」であるProtBERTを活用し、IL‑2関連の信号をよりよく認識するよう微調整しました。交差検証と独立したテストセットによる広範な検証の結果、最も優れた成績を示したのはExtra Treesというモデルと、二量体の期待平均からの偏差(DDE)と呼ばれる特徴セットの組み合わせでした。このモデルは約80%に近い精度と高い相関スコアを達成し、複数のディープラーニング手法を上回りました。

ウイルス世界を走査して隠れた免疫トリガーを探す
最良のモデルを手にした研究者らは、より広範囲の探索を行いました。14,000超のウイルスから参照タンパク配列を収集し、これらのタンパクを約1.56億の重複ペプチドに切り分け、どれがIL‑2を誘導する可能性があるかをモデルに予測させました。スコアの高い候補には、ウエストナイル、ジカ、黄熱、C型肝炎といったフラビウイルス科のものや、インフルエンザ、SARS‑CoV‑2由来のペプチドが含まれていました。多くの有望なペプチドはウイルスのエンベロープやヌクレオカプシドタンパク由来で、これらの種類のタンパクが動物実験でIL‑2応答を誘発することを示した他の研究結果と一致します。さらに、細菌を感染させるバクテリオファージ由来の潜在的なIL‑2誘導ペプチドも指摘され、免疫に関連する配列のランドスケープがさらに広い可能性を示しました。
アルゴリズムから利用しやすいツールへ
研究成果を計算室の外でも使えるようにするため、著者らはIL2Pepscanという公開ウェブサーバを構築しました。研究者はペプチドやタンパク配列をサイトに貼り付けてIL‑2誘導の可能性を推定したり、位置を変異させて新しいバリアントを設計したり、タンパク全体をスキャンしてホットスポットを探したり、既知のIL‑2関連モチーフを検索したりできます。本研究は予測された各ペプチドを実験的にすべて確認したわけではありませんが、既存の実験結果との整合性は、IL2Pepscanがさらなる実験検証のための候補を確実に絞り込めることを示唆しています。専門外の読者への要点は、慎重に訓練されたアルゴリズムが巨大な生物データセットをふるいにかけ、将来的にワクチンや免疫療法がより強力で、かつより精密に免疫系を誘導するのに役立つ小さなタンパク断片を特定できるということです。
引用: Arora, P., Abhigyan, R., Periwal, N. et al. IL2Pepscan: A machine learning framework for predicting IL-2 inducing peptides and their identification across global viral proteomes. Sci Rep 16, 6701 (2026). https://doi.org/10.1038/s41598-026-35977-6
キーワード: インターロイキン-2, ペプチドワクチン, 機械学習, ウイルスプロテオーム, 免疫療法