Clear Sky Science · ja
NuConf: DNAおよびRNAのロタマーライブラリとタンパク質設計ソフトウェアMUMBOへの実装
なぜコンピュータ上でDNAとRNAの形を扱うことが重要なのか
近年、コンピュータツールを用いた新規タンパク質の設計は大きく進展しましたが、DNAとRNAはほとんど取り残されてきました。これらの遺伝分子の構造は記録例が希薄であり、AIがそれらの曲がり方、ねじれ方、タンパク質との相互作用を学習することが難しくなっています。本研究はNuConfを紹介します。これはDNAとRNAの構成要素の形状を表現する新しい方法で、既存のタンパク質設計ソフトが核酸とそのタンパク質との接触面も設計できるようにするものです。 
設計者が柔軟な側鎖部分を通常どう扱うか
科学者がコンピュータ上でタンパク質を設計するとき、各側鎖のすべての原子単位の自由度をすべて探るわけではありません。代わりに「ロタマーライブラリ」を使います。これは何千もの既知構造から抽出された一般的な側鎖形状のコレクションです。MUMBOのようなプログラムはこれらの形状を固定されたタンパク質バックボーンに配置し、エネルギー計算でどの組み合わせが最適かを判断します。これまで、DNAやRNA塩基の側部分について同等に実用的なライブラリ、特に同じプログラムでタンパク質、DNA、RNAを同じ土俵で扱えるものは存在しませんでした。
DNAとRNAの好まれる形状を地図化する
著者らはまず、DNA、RNA、およびそれらのタンパク質複合体の高品質な結晶構造から抽出した17万5,000以上のヌクレオチドを調べました。各ヌクレオチドについて、二つの主要な角度を測定しました:一つはバックボーンの糖環のパッキング(pucker)を捉える角度、もう一つはその糖に対する結合塩基の回転を表す角度です。糖はDNAに典型的なものとRNAに典型的なものという二つの大きな形状群を好み、これらの糖形状は塩基の向きと強く結び付いていることが分かりました。言い換えれば、バックボーンの姿勢と塩基の向きは独立ではなく、特徴的な方法で連動して動きます。
構造パターンを実用的なライブラリに変える
これらのパターンを設計プログラムで使える形にするために、チームは統計モデルを適用して複雑な角度分布を少数の明確なピークに分解しました。各ピークは頻繁に使われる塩基方向を表します。DNAおよびRNAの各塩基タイプについて、そして各大まかな糖形状について、3〜6個の好まれる配向を定義し、それぞれの出現頻度も示しました。このコレクションはNuConfと呼ばれ、局所的なバックボーンの姿勢に結び付いたヌクレオシドの「形状カタログ」として機能します。また、詳細を一部犠牲にして計算コストを下げた、より単純なバックアップ版も作成しました。 
新しい形状が本当に機能するかを検証する
研究者らはこれらの形状をMUMBOに組み込み、二つの問いを立てました:固定されたバックボーンを与えられたとき、プログラムは実際の構造で観察された元の塩基位置を再現できるか、そしてエネルギー評価のみで良い形状と配列を選べるか(正解を教えずに)──という点です。数万のヌクレオチドを含む大規模なテストセットにおいて、NuConfライブラリは塩基位置を既存のタンパク質側鎖用の標準ライブラリと同等、あるいはそれ以上の精度で再現しました。プログラムが形状を純粋にエネルギーで選ぶ場合でも、NuConfはより単純なライブラリや競合する核酸ツールを上回り、自由核酸とタンパク質–核酸複合体の両方で重要な塩基対形成やスタッキングの接触をとらえました。
将来の分子設計にとっての意義
専門外の方への主な要点は、著者らがタンパク質と核酸の双方に対するコンピュータ支援設計の新たな共通言語を提供したことです。NuConfにより既存のタンパク質設計ソフトは、与えられたバックボーンやタンパク質接触部位に沿ってDNAおよびRNAの塩基を確実に配置し選択できるようになります。これは現代のAI手法を置き換えるものではありませんが、訓練データが少ない場合や微細な物理的相互作用を評価する必要がある場合に重要な隙間を埋めます。長期的には、この種のツールは、より精密な遺伝子調節因子、RNAスイッチ、ハイブリッドなタンパク質–核酸機械を実験室で構築する前に完全にインシリコで設計する手助けになる可能性があります。
引用: Makarova, M.O., Stiebritz, M.T., Basturk, D. et al. NuConf: a rotamer library for DNA and RNA and its implementation in the protein design software MUMBO. Sci Rep 16, 16281 (2026). https://doi.org/10.1038/s41598-026-52380-3
キーワード: 核酸設計, ロタマーライブラリ, タンパク質–DNA相互作用, RNAモデリング, 計算構造生物学