Clear Sky Science · ja
配列依存的な核酸モーターの応答を定量化するための情報理論的アプローチ:ナノポアDNAシーケンスへの応用
小さな機械でDNAを読む
体内のすべての細胞は、DNA上を這いながらそれを複製・修復する微小な機械に依存しています。同種の機械は現在、高速DNAシーケンス装置にも利用されています。本研究は一見単純だが重要な問いを投げかけます:ナノポアシーケンシングで通常使われる電気信号に加えて、これらの小さな機械の動き―停止時間や後ろへのステップ頻度―には配列に関するどれほど多くの追加情報が隠されているのか。情報理論の手法を用いて、著者らはこうした微妙な運動がDNA読み取りの精度を大幅に高めうることを示し、将来のシーケンシング技術のためにより良い分子モーターを設計する方策を概説しています。

ナノポアはDNAをどのように信号に変えるか
ナノポアシーケンシングは、単一のDNA鎖を膜の微小な孔に通しながら孔を流れるイオン電流を測定することで機能します。異なる塩基群が孔の最狭部に入ると、それぞれが電流を部分的に遮り、特徴的な電気パターンを生じます。このパターンを解読して配列が推定されます。ここではHel308というヘリカーゼがDNAを掴んで小刻みに孔へ送り込むモーター酵素として働きます。したがって各シーケンスの“リード”は単なる電流トレースではなく、ヘリカーゼの動き—各位置での滞留時間やたまに起こる後戻り—の詳細な記録でもあります。
隠れた手がかりを測るための情報理論の応用
著者らは相互情報量という概念を用いて、DNA配列がさまざまな観測量をどれほど強く支配しているかを定量化します:イオン電流、Hel308が各ステップで費やす時間、そして後戻りする確率です。相互情報量はビット単位で測られ、ある信号から平均してどれだけ配列について学べるかを答えます。数千件の測定を解析した結果、イオン電流は孔の狭窄部に位置する約4塩基の短い配列に最も敏感である一方、Hel308の運動は主に孔から16–21塩基離れた位置にある塩基に支配されていることが示されました。特に、孔からおよそ17番目と20番目の2つの位置にある塩基は、酵素の滞留時間や後戻りしやすさに強い影響を与えます。滞留時間と後戻りの挙動を組み合わせると、どちらか一方だけよりもこれらの塩基について多くを明らかにできます。
運動から配列へのマップを作る
シーケンシング装置ではしばしば、隣接するk個の塩基群を特徴信号に結びつける「k-mer」モデルが使われます。本研究ではその考えをヘリカーゼの運動に適用しています。著者らは、鍵となる位置にある特定の塩基ペアや三塩基が滞留時間や後戻りのパターンを共同で決定するようなモデルを構築しました。情報理論の解析により、例えば位置17と20の塩基の組合せや、位置16・17・20を含むトリマーのような特定の組合せが、単一塩基よりはるかに多くの情報を持つことが示されました。言い換えれば、酵素は一度に一つの塩基だけを“感じる”のではなく、鎖に散在する小さな配列モチーフに応答しており、その応答は系統的に写像化できるのです。

シミュレーションされたシーケンスで大きな利得を確認
この追加的な運動に基づく情報が実際にどれほど有用かを試すため、研究チームは電流と動力学の両方の現実的モデルを用いてナノポアシーケンスの走行をシミュレートしました。次に復号アルゴリズムを用いて、電流のみ、動力学のみ、あるいは両者を合わせた三種類の入力からDNA配列を再構成しました。電流のみでも既に良好な性能を示しますが、動力学のみは精度が劣ります。しかし両者を組み合わせると誤差率は急激に低下します—高カバレッジでは電流のみの場合と比べて約4〜5倍の改善が見られました。特に、両方の信号を使う少数のリードが電流のみを使った多数のリードを上回ることがあり、動力学データを十分に活用すればより速く、より正確なシーケンシングが可能になることを示唆しています。
分子モーター自体の調整
研究者らはまた、ヘリカーゼを変えることで性能がさらに向上するかを探りました。構造データに基づき、DNAに接触するHel308の個々のアミノ酸を変異させ、これらの変化が滞留時間や後戻りにどう影響するかを調べました。ほとんどの変異はほとんど影響を与えませんでしたが、いくつかは滞留時間や後戻り頻度に大きく系統的な変化を引き起こしつつ、配列感受性は保たれていました。特にタンパク質中の二つの位置は情報解析で浮かび上がった重要な配列位置と対応しており、特定のアミノ酸と酵素の配列感知挙動との直接的な結びつきを示唆します。本研究はまたトレードオフが存在することも示しています:一歩あたりわずかに多くの情報を運ぶ変異体は移動速度が遅く、そのため1秒あたりの総情報量は元の酵素と同等になります。
将来のDNA読み取りがなぜ重要か
専門外の読者にとっての要点は、ナノポアシーケンサーがDNAからの電気パターンを読むだけでなく、分子モーターが鎖を移動する際の挙動を“聞く”こともできるという点です。本研究はその運動にどれだけの追加の配列情報が含まれているかを厳密に測る方法を提供し、それを取り入れることで特に反復領域や拡張された遺伝子アルファベットのような難しい領域で精度を大幅に改善できることを示しています。情報理論を設計やスクリーニングのツールとして使うことで、ポーズやつまずきがDNA配列を読みやすくするようなモーター酵素を系統的にエンジニアリングでき、より速く、より信頼性が高く、多用途なシーケンシング技術への道を開きます。
引用: Craig, J.M., Laszlo, A.H., Brinkerhoff, H. et al. An information theory approach to quantifying the sequence-dependent response of nucleic acid motors with applications to nanopore DNA sequencing. Nat Commun 17, 3231 (2026). https://doi.org/10.1038/s41467-026-69867-2
キーワード: ナノポアシーケンシング, ヘリカーゼの動力学, 情報理論, DNAモーター酵素, k-merモデル