Clear Sky Science · ja
Retentive Networkにより長い配列の効率的なRNA言語モデリングを促進
コンピュータに生命のRNAメッセージを“読む”ことを教える
あなたの体のすべての細胞には、遺伝情報を生きた物質に変えるのを助ける分子であるRNAが満ちています。しかし今日の生物学者は、行ごとに目で追える量をはるかに超えるRNAデータの洪水に直面しています。本論文はRNAretを紹介します。これはRNA配列を言語のように「読む」コンパクトな人工知能モデルで、非常に長い遺伝テキストにも対処できます。その目的は、RNAの折りたたみ方や相互作用、機能的な設計図を背景雑音から区別するような潜在的パターンを明らかにすることであり、現行のツールよりはるかに少ない計算資源でこれを達成する点にあります。
RNAのパターンをとらえる新しい方法
RNAretはRetentive Networkと呼ばれる新興のAI設計に基づいており、これは人間のテキスト向け大規模言語モデルを支えるTransformerの後継として提案されています。配列内のすべての位置を互いに比較する(長い文字列では非常にコストが高くなる)代わりに、Retentiveの手法はモデルが読み進める中で重要な情報を「保持」できるようにし、その計算コストは配列長に比例してのみ増加します。著者らはこのアイデアを両方向を参照するエンコーダに適用し、約1200万パラメータの軽量モデルを構築しました。これにより、標準的な研究用GPU上で数千塩基のRNAを一度に処理できます。

数百万のラベルなしRNA配列から学ぶ
RNAretにRNAの「文法」を教えるため、研究チームはRNAcentralデータベースから約3000万件のノンコーディングRNA配列を、配列の種類や機能に関するラベルを与えずに学習データとして用いました。言語モデリングから借用した戦略を採り、配列の小さな塊を隠してモデルにその欠落部分を予測させます。60万回以上の学習ステップを通じて、RNAretはマスクされたセグメントの予測を着実に学び、塩基配列の配置に関する規則性をとらえていることが示されました。後に研究者がモデルの内部表現を調べたところ、モデルは単にカテゴリを与えられたわけではないにもかかわらず、役割や長さが似たRNAが低次元空間で自然にクラスタを形成しているのを見出しました。
実際の生物学的問題にモデルを適用する
次に、学習されたRNAパターンが実用的な問題解決に役立つかを検証しました。まず、RNAretを微調整して、短い調節性RNAであるマイクロRNAが長いRNA分子の標的領域に結合できるかどうかを判定させました。27,000を超えるmicroRNA–mRNA対の標準ベンチマーク上で、5塩基単位で配列を読むバージョンのRNAretは、いくつかの大型RNA言語モデルや専門の深層学習ツールを上回り、高い精度とF1スコアを達成しました。研究者がモデルの内部にある「保持スコア」を調べると、実験で結合を駆動することが知られるマイクロRNAの“シード”領域と、標的RNA上の対応する部分に自然と注目していることが分かり、モデルの判断が生物学的実体に基づいていることを示しました。

形状の再構築とRNAタイプの分類
次に、単一のRNA鎖がどのように自身を折り返して二次構造を作るかを予測する課題にRNAretを挑ませました。クリーンに整備されたベンチマークデータセットを用いると、最も単純なバージョン(1塩基ずつ読む)は、特に中程度の長さのRNAについて、一般的な深層学習法や熱力学ベースのツールよりも実験的に知られている構造に近い塩基対接触マップを生成することがありました。モデルの出力に、どの塩基が対を作れるかという物理的制約を強制する後処理を組み合わせると、予測はよりクリーンでノイズが少なくなりました。三つ目のテストでは、RNAretはヒトとマウスのゲノム上でタンパク質をコードするRNAと長鎖ノンコーディングRNAを識別することを学びました。トランスクリプト全長を切り刻まずに処理できるため、部分的な配列や長い配列にも強く、古典的なオープンリーディングフレーム手法や多くの競合するRNA言語モデルを上回り、特に大規模なヒトデータセットで優れた成績を示しました。
高速・効率的で、拡張の余地がある
精度に加えて、RNAretは高速化を念頭に設計されています。保持ベースのアーキテクチャのおかげで、事前学習時には単一の高性能GPUで毎秒およそ十万個のRNA単位を処理し、構造予測や分類の微調整時にも効率性を保ちます。多くの近年の生物学向け言語モデルよりずっと小型でありながら、多様なタスクで最先端またはそれに近い性能を達成しています。著者らは、Retentive Networkが生物配列解析の実用的で解釈可能なエンジンになり得ることの概念実証を示したと考えています。さらなる調整やDNA・タンパク質への拡張により、RNAretや関連モデルは、生の配列データから分子の相互作用、折りたたみ、生命の指令の遂行に関する洞察を引き出す日常的なツールになる可能性があります。
引用: Shen, Y., Cao, G., Hu, Y. et al. Retentive Network promotes efficient RNA language modeling of long sequences. Commun Biol 9, 575 (2026). https://doi.org/10.1038/s42003-026-09757-x
キーワード: RNA言語モデル, Retentive Network, RNA構造予測, マイクロRNA相互作用, 長鎖ノンコーディングRNA