Clear Sky Science · ja
メタゲノム・マイニングと機械学習によるCas9のPAM多様性の解明
将来の遺伝子編集にとってなぜ重要か
CRISPRは現代の遺伝子編集の象徴となっていますが、静かな制約がその応用範囲を狭めています:DNA切断は常に短い「許可証」配列の隣で起こる必要があるという点です。これらの短い配列、PAM(プロトスペーサ隣接モチーフ)は、人気のCas9酵素がどこで働けるかを決めます。本研究は、膨大な微生物DNAを掘り下げ、先進的な機械学習を組み合わせることで、この許可証に隠された多様性を明らかにできることを示しています。この新しい地図は、ヒトゲノム内のより多くの部位を正確かつ安全に標的とする道を開く可能性があります。
CRISPR切断を導く隠れたルール
Cas9や関連酵素は細菌や古細菌に見られる自然免疫系の一部です。自分自身のDNAを切らないようにするため、これらの微生物はCasタンパク質にターゲット部位の隣にある非常に短い配列、すなわちPAMを探させます。PAMが存在する場合にのみCas9はDNAをほどき、ガイドRNAが配列照合を行い、一致すれば切断を引き起こします。医療にとっての問題は、標準的なCas9(例:Streptococcus pyogenes由来)が認識するPAMパターンが狭いことです。病気原因となる変異の近傍に適切な配列がなければ、現行のツールでは精度を犠牲にせずにはその部位に届かないのです。

新たな選択肢を求めて微生物世界を掘る
著者らは、自然界で異なるCas9タンパク質がどのようにさまざまなPAMを認識するかを体系的に図にすることを目指しました。彼らは380万以上の細菌・古細菌ゲノムと、微生物に感染または移動する740万以上のウイルス・プラスミド配列を精査しました。CRISPR配列を特定し、それらを近傍のCas9遺伝子に結び付け、記憶として保存されたスペーサー配列を侵入するウイルスやプラスミドと照合することで、実際の標的の両側にどのような短いDNA配列が頻出するかを把握しました。ここからCRISPR-PAMdbを構築し、8003のCas9グループそれぞれにコンセンサスPAMプロファイルを対応させ、系統樹上に整理しました。その結果、系統的に近いCas9酵素は似たPAM嗜好を共有する傾向がある一方で、全体として顕著な多様性が存在することが示されました。
データが不足するときはモデルに学ばせる
この大規模調査を行っても、見つかった多くのCas9タンパク質は、PAMを直接読み出せるだけの一致するウイルス標的が不足していました。ギャップを埋めるため、チームはCICEROと呼ばれる機械学習モデルを構築しました。CICEROはアミノ酸配列の一般的パターンを学習した強力なタンパク質の「言語モデル」を用い、それを微調整して、任意のCas9に対してPAMの10塩基位置それぞれにどの塩基が現れやすいかを予測します。このモデルはCRISPR-PAMdbのPAMプロファイルで訓練され、交差検証や実験的にPAMが測定されている79のCas9酵素を用いたテストで、予測と実測の間に強い一致を示しました。

どれだけ自信を持てるかを知る
CICEROの重要な特徴は、単にPAMを推定するだけでなく、その推定がどれほど信頼できるかも見積もる点です。PAMパターンの予測を学習した後、研究者らは同じCas9配列を入力として受け取り、PAM予測の精度を予測する軽量な第2のネットワークを訓練しました。高い信頼度スコアは実際の精度の高さと強く相関しました。この信頼度フィルターを用いることで、チームはさらに5万以上のCas9タンパク質にPAM注釈を拡張し、そのうち1万7千以上を高信頼として分類しました。これにより、標的ルールが比較的よく理解されたCas9バリアントの選択肢が大幅に広がりました。
遺伝性疾患の治療にとっての意味
これらの新しいリソースの意義を示すために、著者らはClinVarデータベースに登録された何万もの疾患関連の一塩基変異を調べ、原理的にベースエディター(両鎖を切断せずに一塩基を変換するツール)で修正可能かどうかを判定しました。標準的なCas9酵素はその厳しいPAM要求のために、このような部位の約半分にしかアクセスできないことが分かりました。CRISPR-PAMdb由来の近縁Cas9や、高信頼のCICERO予測で認識される幅は広いが依然特異的な近傍配列を許容すると、ほぼすべての変異が理論上到達可能になり、標的の精度を大きく損なうことなく治療候補領域が広がります。
より豊富な正確なDNA手術の道具箱
平たく言えば、この研究は二つのものを構築しました:数千の天然Cas9タンパク質とそれらが好む短いDNA配列を結び付けた巨大で公開された地図、そして配列から多くの酵素についてその嗜好を予測できるAIガイドです。これらは微生物世界を将来の遺伝子編集ツールの豊かな部品ライブラリへと変えます。研究者がこれらのCas9バリアントを実験室で改良・検証していけば、臨床家はかつて手の届かなかった病原性変異にも到達できる、より安全で多用途なツールを手にし、真に精密なゲノム手術が現実に近づくでしょう。
引用: Fang, T., Bogensperger, L., Feer, L. et al. Uncovering Cas9 PAM diversity through metagenomic mining and machine learning. Nat Commun 17, 2510 (2026). https://doi.org/10.1038/s41467-026-69098-5
キーワード: CRISPR-Cas9, PAMの多様性, メタゲノミクス, 機械学習, ゲノム編集