Clear Sky Science · ja
大規模言語モデルを用いた主要タンパク質による高解像度のファージ-宿主同定
腸内の見えないウイルスを探す
私たちの腸内には数兆もの細菌とそれを宿すウイルスが存在し、その多くは未解明のままである。これらの隠れたウイルスは消化から肥満まで健康に影響を与える可能性があるが、どのウイルスがどの細菌に感染するかは不明なことが多い。本研究は、わずかな主要ウイルスタンパク質のみを使って腸内ウイルスを細菌宿主に結びつける新しいデータ駆動型ツール、VirHost Hunterを紹介し、マイクロバイオームをより精密に研究し制御する道を開く。
ウイルスと細菌を結びつける新たな手法
従来のウイルス–宿主対応の方法は、完全なウイルスゲノムやCRISPRマーカーのような特別な遺伝的手がかりに依存している。これらの手法は適切な参照データが存在する場合にしか機能せず、多くのウイルス配列(いわゆるウイルスの暗黒物質)を見逃すことがある。本研究の著者らは代わりに感染に中心的な二種類のウイルスタンパク質に注目する:ウイルスが細菌を認識し付着するのを助ける尾部タンパク質と、細菌の細胞壁を破るのを助けるライシンである。これらのタンパク質に着目することで、無関係な遺伝子のノイズを避け、ウイルスゲノムが断片しか得られない場合でも利用できる。

タンパク質とDNAの言語をコンピュータに教える
これらのタンパク質から意味を読み取るために、チームは人間の言語向けに開発された機械学習手法を応用する。アミノ酸配列を密な数値表現に変換するタンパク質言語モデルProtT5を用い、配列が一見異なっていても潜在的な機能的類似性を捉える。同時に、これらのタンパク質をコードするDNAはVision Transformerモデルとマルチパス畳み込みネットワークで解析され、典型的なコドン使用やDNA上の長距離パターンといった特徴を抽出する。こうして得られたタンパク質とDNAの信号を統合し、組合せでどの細菌科・属・種にそのウイルスが感染するかを判断する二つの分類器に入力する。
より鋭く、より深い宿主予測
研究者らはVirHost Hunterをいくつかのバクテリオファージのベンチマーク集合で評価した。タンパク質情報とDNA情報を組み合わせることで、いずれか一方だけを使う場合より明確に優れること、また尾部タンパク質とライシンに集中することで、頭部やパッケージング酵素など他のウイルス成分を使うより良い予測が得られることを示した。細菌分類の異なる階層にわたって、VirHost Hunterは既存のアラインメントフリーなツールより高精度であり、ウイルス間の配列類似性が低い場合でも信頼性を保つ。実験的に宿主が知られている培養腸ファージに対する評価では、標準的なCRISPRベースの方法よりも高い精度で正しい宿主を同定し、両手法を併用するとさらに結果が向上する。
疾患に結びつく隠れた腸内ウイルスの発見
較正済みモデルを用いて、チームはかつてエントリの3分の1未満にしか宿主情報がなかった大規模なHuman Gut Phage DatabaseにVirHost Hunterを適用した。尾部タンパク質とライシンをスキャンすることで、宿主が割り当てられたファージの割合をほぼ二倍に増やし、炎症性腸疾患、心疾患、肥満などの慢性疾患に関連する多くの腸内細菌29科を標的とするウイルスを明らかにした。特にAkkermansia muciniphilaやPrevotella copriといった自己免疫や代謝障害に関与するとされるが既知のファージがなかった細菌を感染源と予測する未記載のファージを多数見出した点が注目される。

デジタル予測から標的型抗菌剤へ
これらの予測を実用的な資源に転換するため、著者らは腸内宿主がマッピングされた10万以上のライシンを含むGut Phage Lysin Databaseを構築した。彼らは構造、安定性、多様性を調べ、細菌細胞壁破壊に関与する多数の異なるクラスタと保存されたモチーフを明らかにした。概念実証として、著者らは肥満と関連する細菌Megamonasを特異的に標的と予測された一つのライシンを選び、合成して試験したところ、そのタンパク質は他の一般的な腸内微生物やプロバイオティクス株を生かしつつMegamonasを効率的に殺菌することが実験室試験で示された。これはモデリングに導かれたウイルス暗黒物質の掘り起こしが高度に選択的なツールを生み出し得ることを示している。
将来のマイクロバイオーム医療にとっての意義
本研究は、わずかな主要タンパク質と現代の機械学習を用いることで、膨大な数の未知の腸内ウイルスをその細菌宿主に結びつけることが可能であることを示した。マイクロバイオーム内で誰が誰に感染するかを明らかにすることで、VirHost Hunterは腸内ウイルスの多様性を探る能力を高め、有害な細菌を広範な微生物群集を乱すことなく選択的に抑制するような、例えば標的化されたライシンといった精密な介入を設計する道を開く。臨床応用にはさらなる検証と設計改良が必要だが、この枠組みは隠れたウイルス配列を研究や最終的には内在生態系の調整に向けたターゲット戦略へと転換するための有力なロードマップを提供する。
引用: Du, Z., Li, M., Lin, K. et al. High-resolution phage-host assignment through key proteins using large language models. Nat Commun 17, 4439 (2026). https://doi.org/10.1038/s41467-026-70613-x
キーワード: 腸内ウイローム, バクテリオファージ, 機械学習, ファージ由来ライシン, マイクロバイオーム治療