Clear Sky Science · ja

大腸菌で発現させた非天然タンパク質によるデータの保存と検索

· 一覧に戻る

データをタンパク質に変える意味

スマートフォン、センサー、オンライン活動が世界を情報で溢れさせる中、現在のハードドライブや磁気テープがいつまでも対応できるとは限りません。本研究はまったく異なる発想を探ります:一般的な細菌で生成できる実験室製のタンパク質にデジタルデータを保存するというものです。著者らは、これらの設計タンパク質がメッセージを保持でき、DNAより過酷な条件に耐えること、さらに選択的アクセスや「ロックされた」秘密情報のような高度な仕組みをサポートできることを示しています。

Figure 1
Figure 1.

1と0からアミノ酸の鎖へ

デジタルファイルは結局のところ長い1と0の列です。研究者たちはまずこれらのビットをアミノ酸配列に変換します。各アミノ酸は3ビットの短いパターンを表すよう選ばれており、アミノ酸の鎖が符号化されたメッセージになります。これらの人工配列はさらに長いタンパク質設計に組み込まれ、大腸菌(バイオテクノロジーで広く使われる作業用細菌)内で生産されます。生成されたタンパク質は乾燥して粉末にされ、情報を保持する物理的媒体になります。

初期設計が苦戦した理由とコラーゲンが示した道

チームの最初のアプローチは、多くのデータ担持セグメントを単一の長いタンパク質につなげるというものでした。紙の上では洗練されていましたが、これらの非天然鎖は大腸菌内でうまく振る舞わず、生産性が低く、細胞の酵素によって簡単に切り刻まれてしまいました。これを解決するために、研究者たちは骨や化石に見られ、何百万年も残り得る強靭な構造タンパク質であるコラーゲンに着想を得ました。彼らはコラーゲンの反復パターンを模した新しいテンプレートを構築し、細菌で発現しやすいことが知られるコラーゲン様ドメインと融合させました。このコラーゲン風の枠組みはデータを符号化する余地を残しつつ、全体のタンパク質に細胞が許容できるより自然な形状を与え、不必要な分解に抵抗します。

タンパク質メモリの書き込み、読み出し、スケールアップ

コラーゲンに触発された設計により、研究者たちは英語の文章や複数言語の有名な引用をいくつかの異なるタンパク質にうまく保存しました。大腸菌がこれらのデータ担持タンパク質を実用的な収率で生産できること、標準的な生化学ツールで過度の手間なく精製できることを示しました。保存された情報を読むには、タンパク質を酵素でより短い断片に切断し、断片の質量を測定する高感度の質量分析計で解析します。専用ソフトウェアが元のアミノ酸配列を再構成し、それを再びビットに変換します。断片の約1割が欠落または誤りでも、組み込みの誤り訂正コードにより、複数の異なるタンパク質が混ざった状態でも完全なメッセージを正確に復元できます。

Figure 2
Figure 2.

安定性、選択的アクセス、隠されたメッセージ

分子ストレージの主要な利点は長期保存性です。著者らはコラーゲン様タンパク質の一つと、同じメッセージを持つDNA配列を高温かつ強酸性の条件下で比較しました。タンパク質は70度で数日間、非常に低いpHでも質量の大部分を保ち読み取り可能であった一方、DNAは急速に分解しました。さらに、タンパク質末端に追加した短いタグがバーコードのように機能することを示し、対応する抗体を用いることで複雑な混合物から特定の引用に関連するタンパク質だけを引き出し、その部分のデータだけを読み取れることを実証しました。「デコイ」タンパク質を通常のタグで混ぜ、「秘密の」タンパク質を特別なタグでのみマークすることで、正しいタグを知る者だけが隠されたメッセージを確実に取り出せるという単純な分子暗号の形も構築しました。

データの未来にとっての意義

本研究は、まったく新しい非天然タンパク質が書き込み、保存、正確な読み出しまでを含む堅牢なデジタル媒体として機能し得ることを初めて完全に実証しました。現時点の容量や速度は日常利用には遠いものの、このアプローチは特に長期アーカイブにおいて非常に高い潜在的密度と卓越した安定性を提供します。タンパク質の設計、生産、シーケンシングの技術が進み続ければ、タンパク質に符号化されたデータはDNAや従来ハードウェアを補完し得て、地球上や宇宙での耐久性の高いアーカイブを可能にし、慎重な管理のもとでは生体内に直接情報を保存する可能性さえ開くかもしれません。

引用: Zhou, Y., Ng, C.C.A., Liu, C. et al. Data storage and retrieval with unnatural proteins expressed via E. coli. Nat Commun 17, 3320 (2026). https://doi.org/10.1038/s41467-026-70061-7

キーワード: タンパク質データ保存, 分子メモリ, 大腸菌発現, コラーゲン様タンパク質, データ暗号化