Clear Sky Science · ru
Хранение и извлечение данных с помощью неестественных белков, экспрессируемых в E. coli
Почему перевод данных в белок важен
Наши телефоны, датчики и онлайн‑жизнь наводняют мир информацией, и современные жесткие диски и магнитные ленты не гарантированно выдержат это вечно. В этом исследовании рассматривается принципиально иная идея: хранение цифровых данных внутри синтетических белков, которые можно производить обычными бактериями. Авторы показывают, что такие специально созданные белки способны вмещать сообщения, выдерживают суровые условия лучше, чем ДНК, и даже поддерживают продвинутые приемы, такие как выборочный доступ и «заблокированная» секретная информация.

От единиц и нулей к цепочкам строительных блоков
Любой цифровой файл в конечном итоге представляет собой длинную строку единиц и нулей. Исследователи сначала преобразуют эти биты в последовательность аминокислот — маленьких строительных блоков белков. Каждая выбранная аминокислота соответствует короткому шаблону из трех бит, поэтому цепочка аминокислот становится закодированным сообщением. Эти искусственные последовательности затем вставляют в более длинные конструкции белков и синтезируют внутри Escherichia coli — широко используемой в биотехнологии рабочей лошадки. После синтеза белки сушат в порошок, который и становится физическим носителем информации.
Почему ранние конструкции давали сбои и как помог коллаген
Первый подход команды просто сшивал вместе множество сегментов, несущих данные, в один длинный белок. Хотя идея выглядела элегантно на бумаге, такие неестественные цепочки плохо вели себя внутри E. coli: их плохо синтезировали и клеточные ферменты легко расщепляли их. Чтобы исправить это, исследователи вдохновились коллагеном — прочным структурным белком, встречающимся в костях и ископаемых останках, способным сохраняться миллионы лет. Они создали новый шаблон, имитирующий повторяющийся узор коллагена, и соединили его с доменом, похожим на коллаген, который хорошо экспрессируется в бактериях. Такая коллагеноподобная основа по-прежнему оставляет место для кодирования данных, но придает белку более естественную форму, которую клетка может терпимо воспринимать и которая лучше противостоит нежелательному разрушению.
Запись, чтение и масштабирование белковой памяти
С коллагеноподобным дизайном ученые успешно сохранили английский текст и знаменитые цитаты на нескольких языках в нескольких разных белках. Они показали, что E. coli может производить такие белки в практичных выходах, а стандартные биохимические методы позволяют очищать их без экстремальных усилий. Для чтения сохраненной информации белки расщепляют на более короткие фрагменты ферментом, а затем анализируют с помощью чувствительного масс‑спектрометра, который взвешивает эти фрагменты. Пользовательское программное обеспечение восстанавливает исходные аминокислотные последовательности и преобразует их обратно в биты. Даже когда примерно один из десяти фрагментов отсутствует или искажен, встроенные коды коррекции ошибок позволяют точно восстановить полные сообщения, включая случаи, когда смешано много разных белков.

Стабильность, выборочный доступ и скрытые сообщения
Ключевое обещание молекулярного хранения — долгий срок службы. Авторы сравнили один из своих коллагеноподобных белков с последовательностью ДНК, несущей то же сообщение, при горячих и сильно кислых условиях. Белок сохранил большую часть массы и оставался читаемым после нескольких дней при 70 градусах Цельсия и при очень низком pH, тогда как ДНК быстро деградировала. Затем они показали, что короткие дополнительные метки, добавленные к концам белка, могут действовать как штрихкоды: с помощью соответствующих антител можно извлечь только те белки, которые относятся к выбранной цитате из сложной смеси, и прочитать только эту часть данных. Комбинируя «обманные» белки с обычными метками и «секретные» белки, помеченные только специальными метками, они построили простую форму молекулярной криптографии, при которой только тот, кто знает правильную метку, может достоверно извлечь скрытое сообщение.
Что это означает для будущего данных
Эта работа демонстрирует первое полноценное подтверждение того, что полностью новые, не‑натуральные белки могут выступать в роли надежного носителя цифровых данных — от записи и хранения до точного считывания. Хотя текущие емкости и скорости далеки от повседневного применения, подход предлагает очень высокую потенциальную плотность и впечатляющую стабильность, особенно для долговременного архивирования. По мере того как инструменты для проектирования, производства и секвенирования белков продолжают развиваться, данные, закодированные в белках, могли бы дополнять ДНК и традиционное оборудование, обеспечивая долговечные архивы на Земле или даже в космосе, а при строгих мерах предосторожности возможно и хранение информации непосредственно внутри живых систем.
Цитирование: Zhou, Y., Ng, C.C.A., Liu, C. et al. Data storage and retrieval with unnatural proteins expressed via E. coli. Nat Commun 17, 3320 (2026). https://doi.org/10.1038/s41467-026-70061-7
Ключевые слова: хранение данных в белках, молекулярная память, экспрессия в E. coli, белки, похожие на коллаген, криптография данных