Clear Sky Science · pl
Przechowywanie i odczyt danych za pomocą nienaturalnych białek ekspresjonowanych przez E. coli
Dlaczego zamiana danych na białko ma znaczenie
Nasze telefony, czujniki i aktywność online zalewają świat informacjami, a dzisiejsze dyski twarde i taśmy magnetyczne mogą kiedyś nie wystarczyć. W tym badaniu zbadano zupełnie inne podejście: przechowywanie danych cyfrowych wewnątrz laboratoryjnie wytwarzanych białek, które można produkować za pomocą powszechnych bakterii. Autorzy pokazują, że te niestandardowe białka mogą pomieścić wiadomości, przetrwać trudne warunki lepiej niż DNA, a nawet wspierać zaawansowane sztuczki, takie jak selektywny dostęp i ukryte, „zablokowane” informacje.

Od jedynek i zer do łańcuchów budulca
Każdy plik cyfrowy jest w gruncie rzeczy długim ciągiem jedynek i zer. Badacze najpierw przekształcili te bity w sekwencję aminokwasów — małych jednostek budujących białka. Każdy wybrany aminokwas odpowiada krótkiemu wzorcowi trzech bitów, więc łańcuch aminokwasów staje się zakodowaną wiadomością. Te sztuczne sekwencje są następnie wstawiane do dłuższych projektów białkowych i produkowane w Escherichia coli, powszechnie stosowanej bakterii w biotechnologii. Po wytworzeniu białka są suszone do postaci proszku, który staje się fizycznym nośnikiem informacji.
Dlaczego wczesne projekty napotykały problemy, a kolagen wskazał drogę
Pierwsze podejście zespołu polegało na połączeniu wielu segmentów niosących dane w jedno długie białko. Choć eleganckie na papierze, te nienaturalne łańcuchy źle się zachowywały w E. coli: były słabo produkowane i łatwo rozkładane przez enzymy komórkowe. Aby to naprawić, badacze zainspirowali się kolagenem — wytrzymałym białkiem strukturalnym występującym w kościach i szczątkach kopalnych, które może przetrwać miliony lat. Zbudowali nowy szablon naśladujący powtarzalny wzorzec kolagenu i połączyli go z domeną podobną do kolagenu, o udokumentowanej dobrej ekspresji w bakteriach. Ta kolagenowa ramka nadal pozostawia miejsce na kodowanie danych, ale nadaje białku bardziej naturalny kształt, który komórka toleruje i który opiera się niepożądanemu rozkładowi.
Pisanie, odczyt i skalowanie pamięci białkowej
Dzięki projektowi inspirowanemu kolagenem naukowcy skutecznie zapisali tekst w języku angielskim i słynne cytaty w kilku językach w różnych białkach. Wykazali, że E. coli potrafi wytwarzać te nośniki danych w użytecznych ilościach, a standardowe narzędzia biochemiczne mogą je oczyścić bez wyjątkowego wysiłku. Aby odczytać zapisane informacje, białka są rozcinane na krótsze fragmenty przez enzym, a następnie analizowane za pomocą czułego spektrometru mas, który waży fragmenty. Własne oprogramowanie rekonstruuje oryginalne sekwencje aminokwasów i przekształca je z powrotem w bity. Nawet gdy do około jednego na dziesięć fragmentów brakowało lub były błędne, wbudowane kody korygujące błędy pozwalały na dokładne odzyskanie pełnych wiadomości, także gdy wiele różnych białek było wymieszanych razem.

Trwałość, selektywny dostęp i ukryte wiadomości
Kluczową obietnicą przechowywania molekularnego jest długowieczność. Autorzy porównali jedno ze swoich białek podobnych do kolagenu z sekwencją DNA niosącą tę samą wiadomość w warunkach gorących i silnie kwaśnych. Białko zachowało większość masy i pozostało czytelne po dniach w 70 stopniach Celsjusza oraz w bardzo niskim pH, podczas gdy DNA szybko uległo degradacji. Następnie pokazali, że dodatkowe krótkie znaczniki dodane do końców białek mogą działać jak kody kreskowe: przy użyciu dopasowanych przeciwciał można było wyciągnąć tylko te białka odnoszące się do wybranego cytatu z złożonej mieszaniny i odczytać tylko tę część danych. Poprzez łączenie „zmyłkowych” białek z zwykłymi znacznikami oraz „sekretnych” białek oznakowanych jedynie specjalnymi znacznikami, zbudowali prostą formę molekularnej kryptografii, w której tylko ktoś znający prawidłowy znacznik może niezawodnie odzyskać ukrytą wiadomość.
Co to oznacza dla przyszłości danych
Praca ta dostarcza pierwszą pełną demonstrację, że całkowicie nowe, nienaturalne białka mogą służyć jako trwały nośnik danych cyfrowych — od zapisu i przechowywania po dokładny odczyt. Choć obecne pojemności i prędkości są dalekie od codziennego zastosowania, podejście oferuje bardzo wysoką potencjalną gęstość i imponującą trwałość, zwłaszcza dla archiwizacji długoterminowej. W miarę jak narzędzia do projektowania, wytwarzania i sekwencjonowania białek będą się rozwijać, dane kodowane w białkach mogłyby uzupełniać DNA i tradycyjny sprzęt, umożliwiając trwałe archiwa na Ziemi lub nawet w kosmosie, a potencjalnie pozwalając na przechowywanie informacji bezpośrednio w żywych systemach przy zachowaniu odpowiednich środków ostrożności.
Cytowanie: Zhou, Y., Ng, C.C.A., Liu, C. et al. Data storage and retrieval with unnatural proteins expressed via E. coli. Nat Commun 17, 3320 (2026). https://doi.org/10.1038/s41467-026-70061-7
Słowa kluczowe: przechowywanie danych w białkach, molekularna pamięć, ekspresja w E. coli, białka podobne do kolagenu, kryptografia danych