Clear Sky Science · ja
SamplingDesign:結合変数とモンテカルロサンプリングによる連続最適化でのRNA設計
医療のための新しいツールとしてのRNA設計
RNAは単なる遺伝情報の使者ではなく、遺伝子を制御したり反応を触媒したり、ワクチンの基盤になったりする複雑な立体構造を折りたためます。もし研究者が意図した形に折りたためるRNA配列を確実に設計できれば、より賢いワクチンやプログラム可能な遺伝子スイッチなど、医療向けのカスタム分子ツールを構築できます。本稿はSamplingDesignを紹介します。これは物理学、統計学、最新の機械学習の発想を組み合わせて、RNA設計の困難に取り組む新しい計算手法です。

なぜRNAの形を設計するのは難しいのか
RNA設計は、文字列を選んでそれが丸められたときにちょうど望む折り紙の形になり、ほかの形にはほとんどならないようにする作業に似ています。長さをnとすると可能な配列は4^n通りに増え、中程度の長さでも天文学的な数になります。さらに各配列は目的の構造と競合する膨大な代替折り畳みを取り得ます。有用な設計は、目的構造を最低エネルギー形として有利にするだけでなく、競合する構造の確率を大幅に低くして、可能性の群の中で正しい構造が支配的になるようにしなければなりません。従来の探索法は一度に一箇所か数箇所を調整するため、この選択の迷路で特に長く複雑なRNAではすぐに行き詰まってしまいます。
可能性を一度に探索する新しい方法
候補配列を一つずつ移る代わりに、SamplingDesignは可能性の“雲”全体を扱います。まず目的構造と互換性のあるすべての配列に広がる確率分布を初期化します。ここで互換性とは、対になった位置が化学的に成立する塩基対を形成し得ることを指します。手法は機械学習で広く使われる勾配ベースの最適化を用い、この分布を徐々に再形成して目的構造に良く折り畳まれる配列の確率を上げ、性能の低い候補の確率を下げます。重要なのは、単一配列の単一スコアを最適化するのではなく、現在の分布下でのすべての配列の平均的な性能を最適化する点です。これにより探索は初期に広く、後期に精密に行われます。
塩基の相互作用を捉える
このアプローチの鍵は、RNA上の各位置が互いにどう依存するかをより現実的に表現することです。各ヌクレオチドを独立の選択として扱うのではなく、SamplingDesignは特定の位置を「結合変数」として束ねます。各塩基対について、二者は化学的に許容される6種類の対タイプに対する小さな結合確率表を共有し、無効な組み合わせを自動的に除外します。ループ周辺のミスマッチやトリミスマッチ群のように互いにエネルギーに影響を与える隣接位置にも同様の結合が用いられます。これにより設計空間は有効な配列のみに縮小され、更新が孤立した文字ではなく意義のある塩基対・ミスマッチの選択に直接作用するため、最適化が滑らかになります。

ランダム性に導かれた賢い選択
配列と折り畳みの巨大な空間上で正確な平均を計算することは不可能なため、SamplingDesignはモンテカルロサンプリングに依拠します。各ステップで現在の分布から扱える数の配列を抽出し、熱力学モデルに従って各配列がどれだけうまく折り畳まれるかを評価し、これらのサンプルを用いて目的関数の平均(例えば目的構造の確率)と分布をどのように調整するかを推定します。多数の反復を経て確率質量はより良い配列に移動し、分布は鋭くなっていきます。最終的に単一の最も確率の高い配列を取るのではなく、手法はこれまでに得たすべてのサンプルを記録し、実際に選択した指標で最も良く機能するものを選びます。これにより広い探索の利点を維持しつつ、焦点を失いません。
難問で既存ツールを上回る性能
著者らはSamplingDesignを、簡単なヘアピンから最大400ヌクレオチドの長大で複雑な形状までを含む広く使われるEterna100ベンチマークなど、いくつかの標準的なRNA「パズル」集でテストしました。特に目的構造のボルツマン確率やヌクレオチドの誤折り畳みの頻度を追う「アンサンブル欠陥」など、構造のアンサンブル全体を見るほとんどの尺度で、SamplingDesignは局所探索やより単純な連続手法に依拠する最先端ツールを上回りました。特に最長で最も困難な課題において利点は顕著で、従来のアルゴリズムがしばしば悪い解に陥る一方で、SamplingDesignは目的構造が競合相手と明確に区別される配列を見つけ続けました。
将来のRNA技術にとっての意義
平たく言えば、本研究はRNA設計を段階的な編集ゲームではなく、多数の配列を同時に導かれた探索として扱うことで、特に大きく困難なターゲットに対してよりクリーンで信頼できる折り畳みを生み出せることを示しています。塩基が対や群としてどう相互作用するかをモデル化し、実験的に計算不可能な地形をサンプリングで航行することで、SamplingDesignは異なる設計目標を最適化できる柔軟な枠組みを提供します。著者らはこれをワクチンや治療用のメッセンジャーRNAの調整や実験的制約の導入へ拡張できると示唆しています。計算設計の向上と実験室での検証が組み合わされば、このような手法は抽象的なRNAの設計図を実用的な医療用分子ツールへと変える助けとなるでしょう。
引用: Tang, W.Y., Dai, N., Zhou, T. et al. SamplingDesign: RNA design via continuous optimization with coupled variables and Monte-Carlo sampling. Nat Commun 17, 2950 (2026). https://doi.org/10.1038/s41467-025-67901-3
キーワード: RNA設計, 逆折り畳み, モンテカルロサンプリング, 連続最適化, mRNA治療薬