Clear Sky Science · sv

Datalagring och återläsning med onaturliga proteiner uttryckta via E. coli

· Tillbaka till index

Varför det spelar roll att göra om data till protein

Våra telefoner, sensorer och onlineliv skapar en strid ström av information, och dagens hårddiskar och magnetband kanske inte räcker för evigt. Denna studie utforskar en långt ifrån självklar idé: att lagra digital data i laboratorietillverkade proteiner som kan produceras av vanliga bakterier. Författarna visar att dessa skräddarsydda proteiner kan bära meddelanden, klara hårda förhållanden bättre än DNA och till och med stödja avancerade funktioner som selektiv åtkomst och hemlig ”låst” information.

Figure 1
Figure 1.

Från ettor och nollor till kedjor av byggstenar

Alla digitala filer är i grunden en lång följd av ettor och nollor. Forskarna omvandlar först dessa bitar till en sekvens av aminosyror, de små byggstenarna som utgör proteiner. Varje utvald aminosyra står för ett kort mönster av tre bitar, så en kedja av aminosyror blir ett kodat budskap. Dessa artificiella sekvenser infogas sedan i längre proteindesigner och produceras inne i Escherichia coli, en arbetsmyra bland bakterier som ofta används i bioteknik. När proteinerna väl är framställda torkas de till ett pulver, vilket blir det fysiska mediet som lagrar informationen.

Varför tidiga designer hade problem och hur collagen visade vägen

Teamets första metod sydde helt enkelt ihop många databärande segment till ett långt protein. Fastän elegant i teorin, uppförde sig dessa onaturliga kedjor dåligt i E. coli: de producerades dåligt och klövs lätt sönder av cellens egna enzymer. För att åtgärda detta hämtade forskarna inspiration från kollagen, ett tåligt strukturellt protein som finns i ben och fossiler och som kan bestå i miljontals år. De byggde en ny mall som efterliknar kollagenets repetitiva mönster och förenade den med en kollagenliknande domän som är känd för att uttryckas väl i bakterier. Denna kollageninspirerade ram lämnar fortfarande utrymme för att koda data, men ger hela proteinet en mer naturlig form som cellen kan tolerera och som motstår oönskad nedbrytning.

Skrivning, läsning och skalning av proteinminne

Med den kollageninspirerade designen lyckades forskarna lagra engelsk text och berömda citat på flera språk i flera olika proteiner. De visade att E. coli kan producera dessa databärande proteiner i användbara mängder, och att standardbiokemiska verktyg kan rena dem utan extrema insatser. För att läsa den lagrade informationen klipps proteinerna i kortare bitar av ett enzym och analyseras sedan med ett känsligt massespektrometer som väger fragmenten. Anpassad programvara rekonstruerar de ursprungliga aminosyrasekvenserna och omvandlar dem tillbaka till bitar. Även när upp till ungefär en av tio fragment saknas eller är felaktiga tillåter inbyggda felkorrigeringskoder att hela meddelandena återställs korrekt, inklusive när många olika proteiner blandas ihop.

Figure 2
Figure 2.

Stabilitet, selektiv åtkomst och dolda meddelanden

En viktig fördel med molekylär lagring är lång livslängd. Författarna jämförde ett av sina kollagenliknande proteiner med en DNA-sekvens som bär samma meddelande under heta och starkt sura förhållanden. Proteinet behöll större delen av sin massa och förblev läsbart efter dagar vid 70 grader Celsius och vid mycket låg pH, medan DNA snabbt bröts ner. De visade också att extra korta taggar som läggs till i proteinänden kan fungera som streckkoder: med matchande antikroppar kunde de dra ut endast de proteiner som hörde till ett valt citat ur en komplex blandning och läsa just den delen av datan. Genom att kombinera ”avledande” proteiner med vanliga taggar och ”hemliga” proteiner märkta endast med speciella taggar byggde de en enkel form av molekylär kryptografi, där endast den som känner till rätt taggar kan hämta det dolda meddelandet pålitligt.

Vad detta betyder för datans framtid

Detta arbete levererar den första fullständiga demonstrationen att helt nya, icke-naturliga proteiner kan fungera som ett robust medium för digital data, från skrivning och lagring till noggrann avläsning. Även om dagens kapacitet och hastighet ligger långt från vardagsanvändning erbjuder tillvägagångssättet mycket hög potentiell densitet och imponerande stabilitet, särskilt för långtidsarkivering. När verktyg för att designa, producera och sekvensera proteiner fortsätter att utvecklas kan data kodad i proteiner komplettera DNA och traditionell hårdvara, möjliggöra hållbara arkiv på jorden eller till och med i rymden, och potentiellt låta information lagras direkt i levande system under strikta säkerhetsrutiner.

Citering: Zhou, Y., Ng, C.C.A., Liu, C. et al. Data storage and retrieval with unnatural proteins expressed via E. coli. Nat Commun 17, 3320 (2026). https://doi.org/10.1038/s41467-026-70061-7

Nyckelord: proteindatalagring, molekylärt minne, E. coli-uttryck, collagenliknande proteiner, datakryptografi