Clear Sky Science · de
Daten speichern und abrufen mit unnatürlichen Proteinen, die über E. coli exprimiert werden
Warum es wichtig ist, Daten in Proteine zu verwandeln
Unsere Telefone, Sensoren und Online-Aktivitäten überschwemmen die Welt mit Informationen, und die heutigen Festplatten und Magnetbänder könnten langfristig nicht mithalten. Diese Studie untersucht eine auffallend andere Idee: digitale Daten in im Labor hergestellten Proteinen zu speichern, die von gewöhnlichen Bakterien produziert werden können. Die Autoren zeigen, dass diese maßgeschneiderten Proteine Nachrichten speichern, rauen Bedingungen besser trotzen als DNA und sogar fortgeschrittene Tricks wie selektiven Zugriff und geheime „verschlossene“ Informationen ermöglichen können.

Von Einsen und Nullen zu Ketten von Bausteinen
Jede digitale Datei ist letztlich eine lange Abfolge von Einsen und Nullen. Die Forscher wandeln diese Bits zunächst in eine Abfolge von Aminosäuren um, den kleinen Bausteinen, aus denen Proteine bestehen. Jede gewählte Aminosäure steht für ein kurzes Muster aus drei Bits, sodass eine Kette von Aminosäuren zu einer codierten Nachricht wird. Diese künstlichen Sequenzen werden dann in längere Protein-Designs eingefügt und in Escherichia coli produziert, einem vielseitigen Bakterium, das in der Biotechnologie weit verbreitet ist. Nach der Herstellung werden die Proteine zu einem Pulver getrocknet, das als physisches Medium zur Speicherung der Information dient.
Warum frühe Entwürfe Probleme hatten und Kollagen den Weg zeigte
Der erste Ansatz des Teams verband einfach viele datenführende Segmente zu einem langen Protein. Zwar elegant auf dem Papier, verhielten sich diese unnatürlichen Ketten in E. coli nicht gut: sie wurden schlecht produziert und leicht von den eigenen Enzymen der Zelle zerschnitten. Zur Lösung ließen sich die Forscher von Kollagen inspirieren, einem robusten Strukturprotein, das in Knochen und Fossilien vorkommt und Millionen Jahre überdauern kann. Sie entwickelten eine neue Vorlage, die Kollagens sich wiederholendes Muster nachahmt, und fusionierten sie mit einer kollagenähnlichen Domäne, von der bekannt ist, dass sie in Bakterien gut exprimiert wird. Dieses kollagenartige Gerüst lässt weiterhin Platz zur Codierung von Daten, verleiht dem Gesamtprotein aber eine natürlichere Form, die die Zelle toleriert und die vor unerwünschtem Abbau schützt.
Schreiben, Lesen und Hochskalieren von Proteinspeichern
Mithilfe des kollageninspirierten Entwurfs speicherten die Wissenschaftler erfolgreich englische Texte und berühmte Zitate aus mehreren Sprachen in verschiedenen Proteinen. Sie zeigten, dass E. coli diese datenführenden Proteine in nützlichen Ausbeuten produzieren kann und dass Standard-Biochemie-Werkzeuge sie ohne großen Aufwand reinigen können. Um die gespeicherten Informationen zu lesen, werden die Proteine durch ein Enzym in kürzere Stücke geschnitten und anschließend mit einem empfindlichen Massenspektrometer analysiert, das die Fragmente wiegt. Maßgeschneiderte Software rekonstruiert die ursprünglichen Aminosäuresequenzen und wandelt sie zurück in Bits. Selbst wenn bis zu etwa eines von zehn Fragmenten fehlt oder fehlerhaft ist, erlauben eingebaute Fehlerkorrekturcodes, die vollständigen Nachrichten genau wiederherzustellen — auch wenn viele verschiedene Proteine miteinander vermischt sind.

Stabilität, selektiver Zugriff und versteckte Botschaften
Ein zentrales Versprechen molekularer Speicherung ist Langlebigkeit. Die Autoren verglichen eines ihrer kollagenähnlichen Proteine mit einer DNA-Sequenz, die dieselbe Nachricht trug, unter heißen und stark sauren Bedingungen. Das Protein behielt den Großteil seiner Masse und blieb nach Tagen bei 70 Grad Celsius und bei sehr niedrigem pH-Wert lesbar, während die DNA schnell zerfiel. Anschließend zeigten sie, dass zusätzliche kurze Tags an den Proteinenden wie Barcodes wirken können: Mit passenden Antikörpern konnten sie nur die Proteine zu einem ausgewählten Zitat aus einer komplexen Mischung herausziehen und genau diesen Datenabschnitt lesen. Durch die Kombination aus „Köder“-Proteinen mit gewöhnlichen Tags und „geheimen“ Proteinen, die nur mit speziellen Tags markiert sind, bauten sie eine einfache Form molekularer Kryptographie auf, bei der nur jemand, der das richtige Tag kennt, zuverlässig die verborgene Nachricht abrufen kann.
Was das für die Zukunft der Daten bedeutet
Diese Arbeit liefert die erste vollständige Demonstration, dass völlig neue, nicht natürliche Proteine als robustes Medium für digitale Daten fungieren können — vom Schreiben und Speichern bis zur genauen Auslesung. Zwar liegen die aktuellen Kapazitäten und Geschwindigkeiten noch weit von einem Alltagsgebrauch entfernt, doch der Ansatz bietet ein sehr hohes potenzielles Speicherdichtepotenzial und beeindruckende Stabilität, insbesondere für Langzeitarchive. Mit dem Fortschritt der Werkzeuge zum Entwerfen, Produzieren und Sequenzieren von Proteinen könnten in Proteinen codierte Daten die DNA- und traditionelle Hardware-Speicher ergänzen, langlebige Archive auf der Erde oder sogar im Weltraum ermöglichen und womöglich unter sorgfältigen Sicherheitsvorkehrungen erlauben, Informationen direkt in lebenden Systemen zu speichern.
Zitation: Zhou, Y., Ng, C.C.A., Liu, C. et al. Data storage and retrieval with unnatural proteins expressed via E. coli. Nat Commun 17, 3320 (2026). https://doi.org/10.1038/s41467-026-70061-7
Schlüsselwörter: Protein-Datenspeicherung, molekularer Speicher, E. coli-Expression, kollagenähnliche Proteine, Datensicherheit